第1章 绪论 1
1.1 从云计算到大数据 1
1.2 大数据的定义与特征 4
1.2.1 海量 5
1.2.2 多样性 5
1.2.3 速度 6
1.2.4 价值 6
1.3 大数据的技术体系 6
1.3.1 数据采集 7
1.3.2 数据存储 7
1.3.3 数据处理 8
1.3.4 数据挖掘 9
1.3.5 数据可视化展示 10
1.3.6 大数据隐私安全 10
1.4 小结 11
第2章 大数据存储 12
2.1 非结构化数据 12
2.1.1 分布式文件系统 12
2.1.2 对象存储系统 24
2.2 (半)结构化数据 30
2.2.1 NoSQL数据库系统 30
2.2.2 分析型数据库系统 69
第3章 大数据处理 91
3.1 概述 91
3.2 离线数据处理 93
3.2.1 MapReduce(Hadoop 0.20.2) 96
3.2.2 Pregel 100
3.2.3 Dryad 104
3.3 实时数据处理 109
3.3.1 Storm 109
3.3.2 S4 117
第4章 大数据挖掘 124
4.1 并行数据挖掘 124
4.1.1 概述 124
4.1.2 系统架构 124
4.1.3 关键技术 125
4.2 搜索引擎技术 134
4.2.1 概述 134
4.2.2 系统架构 135
4.2.3 关键技术 137
4.3 推荐引擎技术 174
4.3.1 概述 174
4.3.2 系统架构 175
4.3.3 关键技术 177
4.4 社交网络分析技术 186
4.4.1 概述 186
4.4.2 理论框架 187
4.4.3 关键技术 192
第5章 数据可视化 195
5.1 概述 195
5.2 数据模型与可视化展现形式 195
5.2.1 基本数据可视化展现方式 196
5.2.2 数据模型与常见可视化展现形式 196
5.3 数据可视化在大数据中的应用 219
5.4 数据可视化案例——互联网地图 220
5.5 可视化即服务 221
第6章 大数据应用 222
6.1 大数据的潜在价值 222
6.2 大数据的应用场景 225
6.2.1 企业大数据 225
6.2.2 电信大数据 226
6.2.3 物联网大数据 227
6.3 大数据应用案例 228
6.3.1 应用商店推荐系统 228
6.3.2 WAP用户画像 234
结语 238
参考文献 240