大数据处理平台PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:宋杰著
- 出 版 社:北京:人民邮电出版社
- 出版年份:2017
- ISBN:7115466891
- 页数:219 页
第1章 体系结构 1
1.1 集群系统 2
1.1.1 Hadoop YARN 2
1.1.2 Apache Mesos 3
1.1.3 Apache ZooKeeper 4
1.2 文件系统 5
1.2.1 Google分布式文件系统 6
1.2.2 Hadoop分布式文件系统 8
1.2.3 其他分布式文件系统 9
1.3 NoSQL和NewSQL 12
1.3.1 NoSQL数据库系统 12
1.3.2 NewSQL数据库系统 14
1.4 计算模型 16
1.4.1 MapReduce编程模型 16
1.4.2 Spark并行计算框架 25
参考文献 26
第2章 查询平台 31
2.1 基本原理 32
2.1.1 系统简介 33
2.1.2 架构组织 34
2.2 现有研究 37
2.2.1 大数据精确查询系统 37
2.2.2 大数据近似查询系统 40
2.2.3 大数据多维查询系统 40
2.3 近期成果 43
2.3.1 Haery 43
2.3.2 Probery 56
参考文献 75
第3章 分析平台 81
3.1 基本原理 82
3.1.1 OLAP技术 82
3.1.2 系统架构 84
3.2 现有研究 86
3.2.1 传统OLAP优化方法 86
3.2.2 OLAP存储计算优化 90
3.2.3 大数据OLAP引擎 97
3.3 近期成果 98
3.3.1 DOLAP 99
3.3.2 MapReduce OLAP 109
3.3.3 HaoLap 119
参考文献 121
第4章 迭代计算平台 127
4.1 基本原理 128
4.2 现有研究 129
4.2.1 MapReduce迭代计算框架 130
4.2.2 其他迭代计算框架 132
4.2.3 增量迭代计算 136
4.2.4 迭代算法优化 137
4.3 近期成果 139
4.3.1 增量迭代计算模型 139
4.3.2 归并迭代计算 157
4.3.3 迭代初始点选择 159
参考文献 172
第5章 实时处理平台 175
5.1 基本原理 176
5.2 现有研究 178
5.2.1 Lambda架构 179
5.2.2 队列 181
5.2.3 流处理 183
5.2.4 数据流处理框架 189
5.3 近期成果 200
5.3.1 实时数据迁移模型 201
5.3.2 数据源层的优化方法 207
5.3.3 迁移系统设计 216
参考文献 218
后记 219
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《办好人民满意的教育 全国教育满意度调查报告》(中国)中国教育科学研究院 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《人民院士》吴娜著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《中国人民的心》杨朔著;夕琳编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中华人民共和国成立70周年优秀文学作品精选 短篇小说卷 上 全2册》贺邵俊主编 2019
- 《指向核心素养 北京十一学校名师教学设计 数学 九年级 上 配人教版》周志英总主编 2019
- 《中华人民共和国成立70周年优秀文学作品精选 中篇小说卷 下 全3册》洪治纲主编 2019