第一章 大数据概述 1
第一节 大数据概念 1
第二节 大数据的现状与挑战 3
第三节 大数据的未来展望 18
第二章 大数据的数据获取 23
第一节 数据分类及数据获取组件 23
第二节 数据获取中探针的原理与能力 30
第三节 网页采集与日志收集 39
第四节 数据分发中间件 56
第三章 交互式分析 64
第一节 交互式分析的概念 64
第二节MPP DP技术的应用 65
第三节SQL on Hadoop 84
第四节 大数据仓库的技术分析 88
第四章 批处理技术 93
第一节 批处理技术概念 93
第二节MapReduce编程框架的发展 94
第三节Spark架构和原理解析 98
第四节BSP框架模型的实现 137
第五章 机器学习和数据挖掘 146
第一节 机器学习和数据挖掘的联系与区别 146
第二节 机器学习的方式与类型 148
第三节 机器学习与数据挖掘应用案例 150
第四节 深度学习的实践与发展 152
第六章 大数据中资源管理的发展分析 169
第一节Hadoop领域的资源调度框架 169
第二节 资源分配算法 173
第三节 多租户技术分析 181
第四节Apache Mesos架构和原理 183
第七章 数据中心及云计算的应用实践 202
第一节 大数据及云计算的关系 202
第二节 云资源的管理与调度 210
第三节 开源云管理平台OpenStack 218
第四节 虚拟化技术的发展分析 222
第五节 云存储系统的技术与分类 228
第八章 电子商务与社会化网络大数据分析 257
第一节 推荐系统技术概述 257
第二节 大数据在计算广告中的发展与应用 261
第三节 社交网络中大数据的应用分析 265
第九章 大数据的安全与隐私 269
第一节 大数据时代的安全挑战 269
第二节 解决安全问题的技术研究 275
第三节 大数据隐私的保护分析 283
第十章 大数据架构实例 287
第一节 基于MATLAB的图像处理的特点及应用 287
第二节 基于IT治理的区域医疗卫生大数据架构 290
第三节 微博用户兴趣建模系统架构 296
第四节 铁路客运旅游大数据平台 299
参考文献 309