《大数据技术基础实验教程》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:王素贞,白彦峰编著
  • 出 版 社:石家庄:河北科学技术出版社
  • 出版年份:2018
  • ISBN:9787537596220
  • 页数:338 页
图书介绍:

第1章 Linux操作系统安装与使用 1

1.1 Linux操作系统简介 1

1.2 虚拟机安装 3

1.3 安装Linux 9

1.4 Linux操作 18

实验一 虚拟机及Linux操作系统的安装和使用 29

第2章 Hadoop环境搭建 32

2.1 Hadoop简介 32

2.2 Linux配置 36

2.3 Hadoop安装配置 45

2.4 启动集群 50

实验二 Hadoop环境的搭建 54

第3章 分布式存储HDFS 56

3.1 HDFS原理 56

3.2 HDFS操作 64

3.3 Hadoop开发环境配置 79

3.4 HDFS Java API 85

实验三 分布式存储HDFS 98

第4章 HBase分布式数据库 102

4.1 HBase基础知识 102

4.2 HBase安装 106

4.3 HBase基本应用 110

4.4 HBase编程实例 126

实验四 HBase的安装和使用 137

第5章 Hive数据仓库 140

5.1 Hive基本原理 140

5.2 Hive安装与配置 143

5.3 Hive基本操作 151

实验五 Hive数据仓库的安装和使用 173

第6章 MapReduce并行编程框架 176

6.1 MapReduce并行编程框架原理 176

6.2 MapReduce主要组件与编程接口 181

6.3 MapReduce编程实例 194

实验六 MapReduce并行编程 218

第7章 Spark安装配置与Scala基础 220

7.1 Spark简介 220

7.2 Spark技术体系 222

7.3 Spark安装配置 225

7.4 Scala基础 231

实验七 Spark安装配置与Scala基础 247

第8章 Spark开发基础 249

8.1 RDD原理 249

8.2 RDD编程 253

8.3 Spark开发环境的安装 268

8.4 Spark开发步骤 272

8.5 Spark编程实例 279

实验八 Spark开发基础 286

第9章 Spark SQL操作 288

9.1 Spark SQL基本原理 288

9.2 开发入门 291

9.3 Spark SQL API 294

9.4 对各种数据源的处理 307

9.5 Spark SQL编程进阶 313

实验九 Spark SQL编程 320

第10章 Spark Streaming 323

10.1 Spark Streaming基本原理 323

10.2 Spark Streaming编程 330

实验十 Spark Streaming编程 335

参考文献 337