第一章 云计算背景与Hadoop 1
第一节 云计算定义与体系 1
第二节 Hadoop与云计算 2
第三节 谁在使用Hadoop 3
第二章 云计算基础 6
第二节 分布式计算 6
第二节 云计算的基本概念 7
第三节 云计算的关键技术 8
第四节 云交付模型 11
第五节 云部署模式 15
第六节 云计算的优势与挑战 17
第七节 典型云应用 18
第八节 云计算与大数据 21
第三章 虚拟化技术 24
第一节 为什么需要虚拟化 24
第二节 什么是虚拟化 24
第三节 虚拟化分类 25
第四节 虚拟化技术架构 30
第五节 Virtuozzo 35
第六节 虚拟化关键技术 36
第四章 云存储原型系统集群搭建及云网盘设计与开发 42
第一节 云存储原型系统设计与构建 42
第二节 启动或关闭Hadoop集群系统 52
第三节 云网盘软件设计与开发 52
第四节 云存储原型及云网盘系统测试 52
第五章 云存储软件系统中Web与Hadoop集群的挂接 56
第一节 挂接条件与设置 56
第二节 挂接步骤 56
第三节 基于Hadoop集群的文件上传代码模块 56
第四节 基于Hadoop集群的文件下载代码模块 57
第六章 基于Hadoop的大数据处理架构 58
第一节 Google核心云计算技术 58
第二节 Hadoop云计算技术及发展 64
第三节 基于云计算的大数据处理架构 70
第四节 基于云计算的大数据处理技术的应用 72
第五节 Hadoop运行实践 84
第七章 基于Hadoop数据建模 85
第一节 数据存储选型 86
第二节 HDFS模式设计 94
第三节 HBase模式设计 99
第四节 元数据管理 106
第五节 结论 110
第八章 基于Hadoop系统管理 111
第一节 Hadoop的配置文件 111
第二节 配置Hadoop守护进程 112
第三节 Hadoop配置文件的优先级 113
第四节 深入探究Hadoop配置文件 113
第五节 调度器 120
第六节 从属文件 127
第七节 机架感知 128
第八节 集群管理工具 129
第九章 Hadoop近实时处理 136
第一节 流处理 137
第二节 Apache Storm 139
第三节 Spark Streaming 145
第四节 FIume拦截器 152
第五节 工具选择 153
第十章 基于MapReduce的数据挖掘 156
第一节 数据挖掘及其分布式并行化 156
第二节 基于MapReduce的数据挖掘与Mahout 161
第三节 经典数据挖掘算法的MapReduce实例 165
第四节 基于云计算的数据挖掘实践及面临的挑战 175
参考文献 179