Hadoop+Spark生态系统操作与实战指南PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:余辉著
- 出 版 社:北京:清华大学出版社
- 出版年份:2017
- ISBN:9787302479673
- 页数:337 页
第1章 Hadoop概述 1
1.1 Hadoop简介 1
1.2 Hadoop版本和生态系统 3
1.3 MapReduce简介 7
1.4 HDFS简介 8
1.5 Eclipse+Java开发环境搭建 10
1.5.1 Java安装 10
1.5.2 Maven安装 11
1.5.3 Eclipse安装和配置 12
1.5.4 Eclipse创建Maven项目 16
1.5.5 Eclipse其余配置 19
1.6 小结 21
第2章 Hadoop集群搭建 22
2.1 虚拟机简介 22
2.2 虚拟机配置 24
2.3 Linux系统设置 31
2.4 Apache版本Hadoop集群搭建 36
2.5 CDH版本Hadoop集群搭建 44
2.5.1 安装前期准备 44
2.5.2 Cloudera Manager安装 45
2.5.3 CDH安装 46
2.6 小结 55
第3章 Hadoop基础与原理 56
3.1 MapReduce原理介绍 56
3.1.1 MapReduce的框架介绍 56
3.1.2 MapReduce的执行步骤 58
3.2 HDFS原理介绍 59
3.2.1 HDFS是什么 59
3.2.2 HDFS架构介绍 59
3.3 HDFS实战 62
3.3.1 HDFS客户端的操作 62
3.3.2 Java操作HDFS 65
3.4 YARN原理介绍 69
3.5 小结 71
第4章 ZooKeeper实战 72
4.1 ZooKeeper原理介绍 72
4.1.1 ZooKeeper基本概念 72
4.1.2 ZooKeeper工作原理 73
4.1.3 ZooKeeper工作流程 76
4.2 ZooKeeper安装 78
4.3 ZooKeeper实战 80
4.3.1 ZooKeeper客户端的操作 80
4.3.2 Java操作ZooKeeper 81
4.3.3 Scala操作ZooKeeper 85
4.4 小结 87
第5章 MapReduce实战 88
5.1 前期准备 88
5.2 查看YARN上的任务 95
5.3 加载配置文件 95
5.4 MapReduce实战 96
5.5 小结 121
第6章 HBase实战 122
6.1 HBase简介及架构 122
6.2 HBase安装 127
6.3 HBase实战 129
6.3.1 HBase客户端的操作 129
6.3.2 Java操作HBase 132
6.3.3 Scala操作HBase 136
6.4 小结 140
第7章 Hive实战 141
7.1 Hive介绍和架构 141
7.2 Hive数据类型和表结构 143
7.3 Hive分区、桶与倾斜 144
7.4 Hive安装 146
7.5 Hive实战 148
7.5.1 Hive客户端的操作 148
7.5.2 Hive常用命令 154
7.5.3 Java操作Hive 155
7.6 小结 161
第8章 Scala实战 162
8.1 Scala简介与安装 162
8.2 IntelliJ IDEA开发环境搭建 164
8.2.1 IntelliJ IDEA简介 164
8.2.2 IntelliJ IDEA安装 164
8.2.3 软件配置 166
8.3 IntelliJ IDEA建立Maven项目 171
8.4 基础语法 176
8.5 函数 179
8.6 控制语句 181
8.7 函数式编程 184
8.8 模式匹配 189
8.9 类和对象 191
8.10 Scala异常处理 194
8.11 Trait(特征) 195
8.12 Scala文件I/O 196
8.13 作业 198
8.13.1 九九乘法表 198
8.13.2 冒泡排序 199
8.13.3 设计模式Command 200
8.13.4 集合对称判断 202
8.13.5 综合题 204
8.14 小结 206
第9章 Flume实战 207
9.1 Flume概述 207
9.2 Flume的结构 208
9.3 Flume安装 211
9.4 Flume实战 212
9.5 小结 214
第10章 Kafka实战 215
10.1 Kafka概述 215
10.1.1 简介 215
10.1.2 使用场景 217
10.2 Kafka设计原理 218
10.3 Kafka主要配置 222
10.4 Kafka客户端操作 224
10.5 Java操作Kafka 226
10.5.1 生产者 226
10.5.2 消费者 228
10.6 Flume连接Kafka 229
10.7 小结 233
第11章 Spark实战 234
11.1 Spark概述 234
11.2 Spark基本概念 234
11.3 Spark算子实战及功能描述 238
11.3.1 Value型Transformation算子 238
11.3.2 Key-Value型Transformation算子 242
11.3.3 Actions算子 245
11.4 Spark Streaming实战 248
11.5 Spark SQL和DataFrame实战 253
11.6 小结 266
第12章 大数据网站日志分析项目 267
12.1 项目介绍 267
12.2 网站离线项目 267
12.2.1 业务框架图 267
12.2.2 子服务“趋势分析”详解 268
12.2.3 表格的设计 272
12.2.4 提前准备 274
12.2.5 项目步骤 287
12.3 网站实时项目 297
12.3.1 业务框架图 297
12.3.2 子服务“当前在线”详解 297
12.3.3 表格的设计 302
12.3.4 提前准备 304
12.3.5 项目步骤 327
12.4 小结 337
- 《近代旅游指南汇刊二编 16》王强主编 2017
- 《甘肃省档案馆指南》甘肃省档案馆编 2018
- 《药剂学实验操作技术》刘芳,高森主编 2019
- 《Maya 2018完全实战技术手册》来阳编著 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《你好,生态环境部!》生态环境部编 2019
- 《近代旅游指南汇刊 31》王强主编 2014
- 《Python3从入门到实战》董洪伟 2019
- 《近代旅游指南汇刊二编 10》王强主编 2017
- 《手工咖啡 咖啡爱好者的完美冲煮指南》(美国)杰茜卡·伊斯托,安德烈亚斯·威尔霍夫 2019
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019