《云环境下大数据分析平台关键技术研究》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:戴伟著
  • 出 版 社:北京:中国水利水电出版社
  • 出版年份:2017
  • ISBN:9787517055372
  • 页数:226 页
图书介绍:本书以云计算与大数据基础开篇,简单介绍了分布式文件系统HDFS与NoSQL数据库技术,重点对分布式计算框架MapReduce、Hadoop技术、云数据中心、大数据与数据挖掘技术进行了阐述。本书叙述语言简洁、逻辑清楚、内容详尽,是一本值得学习研究的著作。

第1章 云计算与大数据基础 1

1.1 云计算概述 1

1.2 云计算关键技术简介 13

1.3 大数据时代的机遇与挑战 20

1.4 大数据的技术体系 21

1.5 大数据与云计算之间的关系 25

小结 27

第2章 分布式文件系统HDFS 28

2.1 HDFS概述 28

2.2 HDFS的体系结构 33

2.3 HDFS存取机制 41

2.4 HDFS常用命令 46

2.5 HDFS存储海量数据 59

小结 60

第3章 NoSQL数据库技术 61

3.1 NoSQL及其与关系型数据库的比较 61

3.2 列式存储和文档存储 67

3.3 key-value数据库 86

3.4 图形数据库 87

3.5 NewSQL数据库 88

3.6 基于NoSQL的Megastore存储系统 93

小结 95

第4章 分布式计算框架MapReduce 97

4.1 MapReduce的引入 97

4.2 MapReduce编程模型 101

4.3 MapReduce核心技术分析 115

4.4 MapReduce的应用实践 117

小结 120

第5章 Hadoop技术 121

5.1 集群上的MapReduce实现——Hadoop 121

5.2 对Hadoop技术的深入了解 127

5.3 后Hadoop时代即将来临 142

小结 147

第6章 云数据中心 148

6.1 云数据中心概述 148

6.2 网络融合技术 153

6.3 云数据中心节能技术 154

6.4 虚拟化技术 156

6.5 安全技术 165

6.6 云数据中心的规划与建设 179

6.7 大数据分析 182

小结 183

第7章 大数据与数据挖掘技术 184

7.1 大数据与数据挖掘的关系 184

7.2 数据挖掘的核心思想和主要功能 186

7.3 数据挖掘的内容与主要方法 189

7.4 复杂数据类型挖掘 198

小结 220

参考文献 221