第1章 Linux操作系统安装与使用 1
1.1 Linux操作系统简介 1
1.2 虚拟机安装 3
1.3 安装Linux 9
1.4 Linux操作 18
实验一 虚拟机及Linux操作系统的安装和使用 29
第2章 Hadoop环境搭建 32
2.1 Hadoop简介 32
2.2 Linux配置 36
2.3 Hadoop安装配置 45
2.4 启动集群 50
实验二 Hadoop环境的搭建 54
第3章 分布式存储HDFS 56
3.1 HDFS原理 56
3.2 HDFS操作 64
3.3 Hadoop开发环境配置 79
3.4 HDFS Java API 85
实验三 分布式存储HDFS 98
第4章 HBase分布式数据库 102
4.1 HBase基础知识 102
4.2 HBase安装 106
4.3 HBase基本应用 110
4.4 HBase编程实例 126
实验四 HBase的安装和使用 137
第5章 Hive数据仓库 140
5.1 Hive基本原理 140
5.2 Hive安装与配置 143
5.3 Hive基本操作 151
实验五 Hive数据仓库的安装和使用 173
第6章 MapReduce并行编程框架 176
6.1 MapReduce并行编程框架原理 176
6.2 MapReduce主要组件与编程接口 181
6.3 MapReduce编程实例 194
实验六 MapReduce并行编程 218
第7章 Spark安装配置与Scala基础 220
7.1 Spark简介 220
7.2 Spark技术体系 222
7.3 Spark安装配置 225
7.4 Scala基础 231
实验七 Spark安装配置与Scala基础 247
第8章 Spark开发基础 249
8.1 RDD原理 249
8.2 RDD编程 253
8.3 Spark开发环境的安装 268
8.4 Spark开发步骤 272
8.5 Spark编程实例 279
实验八 Spark开发基础 286
第9章 Spark SQL操作 288
9.1 Spark SQL基本原理 288
9.2 开发入门 291
9.3 Spark SQL API 294
9.4 对各种数据源的处理 307
9.5 Spark SQL编程进阶 313
实验九 Spark SQL编程 320
第10章 Spark Streaming 323
10.1 Spark Streaming基本原理 323
10.2 Spark Streaming编程 330
实验十 Spark Streaming编程 335
参考文献 337