Hadoop技术内幕 深入解析YARN架构设计与实现原理PDF电子书下载
- 电子书积分:13 积分如何计算积分?
- 作 者:董西成著
- 出 版 社:北京:机械工业出版社
- 出版年份:2014
- ISBN:9787111445340
- 页数:377 页
第一部分 准备篇 2
第1章 环境准备 2
1.1准备学习环境 2
1.1.1基础软件下载 2
1.1.2如何准备Linux环境 3
1.2获取Hadoop源代码 5
1.3搭建Hadoop源代码阅读环境 5
1.3.1创建Hadoop工程 5
1.3.2 Hadoop源代码阅读技巧 8
1.4 Hadoop源代码组织结构 10
1.5 Hadoop初体验 12
1.5.1搭建Hadoop环境 12
1.5.2 Hadoop Shell介绍 15
1.6编译及调试Hadoop源代码 16
1.6.1编译Hadoop源代码 17
1.6.2调试Hadoop源代码 18
1.7小结 20
第2章YARN设计理念与基本架构 21
2.1 YARN产生背景 21
2.1.1 MRvl的局限性 21
2.1.2轻量级弹性计算平台 22
2.2 Hadoop基础知识 23
2.2.1术语解释 23
2.2.2 Hadoop版本变迁 25
2.3 YARN基本设计思想 29
2.3.1基本框架对比 29
2.3.2编程模型对比 30
2.4 YARN基本架构 31
2.4.1 YARN基本组成结构 32
2.4.2 YARN通信协议 34
2.5 YARN工作流程 35
2.6多角度理解YARN 36
2.6.1并行编程 36
2.6.2资源管理系统 36
2.6.3云计算 37
2.7本书涉及内容 38
2.8小结 38
第二部分YARN核心设计篇 40
第3章YARN基础库 40
3.1概述 40
3.2第三方开源库 41
3.2.1 Protocol Buffers 41
3.2.2 Apache Avro 43
3.3底层通信库 46
3.3.1 RPC通信模型 46
3.3.2 Hadoop RPC的特点概述 48
3.3.3 RPC总体架构 48
3.3.4 Hadoop RPC使用方法 49
3.3.5 Hadoop RPC类详解 51
3.3.6 Hadoop RPC参数调优 57
3.3.7 YARN RPC实现 57
3.3.8 YARN RPC应用实例 61
3.4服务库与事件库 65
3.4.1服务库 66
3.4.2事件库 66
3.4.3 YARN服务库和事件库的使用方法 68
3.4.4事件驱动带来的变化 70
3.5状态机库 72
3.5.1 YARN状态转换方式 72
3.5.2状态机类 73
3.5.3状态机的使用方法 73
3.5.4状态机可视化 76
3.6源代码阅读引导 76
3.7小结 77
3.8问题讨论 77
第4章YARN应用程序设计方法 78
4.1概述 78
4.2客户端设计 79
4.2.1客户端编写流程 80
4.2.2客户端编程库 84
4.3 ApplicationMaster设计 84
4.3.1 ApplicationMaster编写流程 84
4.3.2 ApplicationMaster编程库 92
4.4 YARN应用程序实例 95
4.4.1 DistributedShell 95
4.4.2 Unmanaged AM 99
4.5源代码阅读引导 100
4.6小结 100
4.7问题讨论 100
第5章 ResourceManager剖析 102
5.1概述 102
5.1.1 ResourceManager基本职能 102
5.1.2 ResourceManager内部架构 103
5.1.3 ResourceManager事件与事件处理器 106
5.2用户交互模块 108
5.2.1 ClientRMService 108
5.2.2 AdminService 109
5.3 ApplicationMaster管理 109
5.4 NodeManager管理 112
5.5 Application管理 113
5.6状态机管理 114
5.6.1 RMApp状态机 115
5.6.2 RMAppAttempt状态机 119
5.6.3 RMContainer状态机 123
5.6.4 RMNode状态机 127
5.7几个常见行为分析 129
5.7.1启动ApplicationMaster 129
5.7.2申请与分配Container 132
5.7.3杀死Application 134
5.7.4 Container超时 135
5.7.5 ApplicationMaster超时 138
5.7.6 NodeManager超时 138
5.8安全管理 139
5.8.1术语介绍 139
5.8.2 Hadoop认证机制 139
5.8.3 Hadoop授权机制 142
5.9容错机制 144
5.9.1 Hadoop HA基本框架 145
5.9.2 YARN HA实现 148
5.10源代码阅读引导 149
5.11小结 151
5.12问题讨论 152
第6章 资源调度器 153
6.1资源调度器背景 153
6.2 HOD调度器 154
6.2.1 Torque资源管理器 154
6.2.2 HOD作业调度 155
6.3 YARN资源调度器的基本架构 157
6.3.1基本架构 157
6.3.2资源表示模型 160
6.3.3资源调度模型 161
6.3.4资源抢占模型 164
6.4 YARN层级队列管理机制 169
6.4.1层级队列管理机制 169
6.4.2队列命名规则 171
6.5 Capacity Scheduler 172
6.5.1 Capacity Scheduler的功能 172
6.5.2 Capacity Scheduler实现 176
6.6 Fair Scheduler 179
6.6.1 Fair Scheduler功能介绍 180
6.6.2 Fair Scheduler实现 182
6.6.3 Fair Scheduler与Capacity Scheduler对比 183
6.7其他资源调度器介绍 184
6.8源代码阅读引导 185
6.9小结 186
6.10问题讨论 187
第7章NodeManager剖析 188
7.1概述 188
7.1.1 NodeManager基本职能 188
7.1.2 NodeManager内部架构 190
7.1.3 NodeManager事件与事件处理器 193
7.2节点健康状况检测 194
7.2.1自定义Shell脚本 194
7.2.2检测磁盘损坏数目 196
7.3分布式缓存机制 196
7.3.1资源可见性与分类 198
7.3.2分布式缓存实现 200
7.4目录结构管理 203
7.4.1数据目录管理 203
7.4.2日志目录管理 203
7.5状态机管理 206
7.5.1 Application状态机 207
7.5.2 Container状态机 210
7.5.3 LocalizedResource状态机 213
7.6 Container生命周期剖析 214
7.6.1 Container资源本地化 214
7.6.2 Container运行 218
7.6.3 Container资源清理 222
7.7资源隔离 224
7.7.1 Cgroups介绍 224
7.7.2内存资源隔离 228
7.7.3 CPU资源隔离 230
7.8源代码阅读引导 234
7.9小结 235
7.10问题讨论 236
第三部分 计算框架篇 238
第8章 离线计算框架MapReduce 238
8.1概述 238
8.1.1基本构成 238
8.1.2事件与事件处理器 240
8.2 MapReduce客户端 241
8.2.1 ApplicationClientProtocol协议 242
8.2.2 MRClientProtocol协议 243
8.3 MRAppMaster工作流程 243
8.4 MR作业生命周期及相关状态机 246
8.4.1 MR作业生命周期 246
8.4.2 Job状态机 249
8.4.3 Task状态机 253
8.4.4 TaskAttempt状态机 255
8.5资源申请与再分配 259
8.5.1资源申请 259
8.5.2资源再分配 262
8.6 Container启动与释放 263
8.7推测执行机制 264
8.7.1算法介绍 265
8.7.2推测执行相关类 266
8.8作业恢复 267
8.9数据处理引擎 269
8.10历史作业管理器 271
8.11 MRvl与MRv2对比 273
8.11.1 MRv1 On YARN 273
8.11.2 MRv1与MRv2架构比较 274
8.11.3 MRv1与MRv2编程接口兼容性 274
8.12源代码阅读引导 275
8.13小结 277
8.14问题讨论 277
第9章DAG计算框架Tez 278
9.1背景 278
9.2 Tez数据处理引擎 281
9.2.1 Tez编程模型 281
9.2.2 Tez数据处理引擎 282
9.3 DAG Master实现 284
9.3.1 DAG编程模型 284
9.3.2 MR到 DAG转换 286
9.3.3 DAGAppMaster 288
9.4优化机制 291
9.4.1当前YARN框架存在的问题 291
9.4.2 Tez引入的优化技术 292
9.5 Tez应用场景 292
9.6与其他系统比较 294
9.7小结 295
第10章 实时/内存计算框架Storm/Spark 296
10.1 Hadoop MapReduce的短板 296
10.2实时计算框架Storm 296
10.2.1 Storm编程模型 297
10.2.2 Storm基本架构 302
10.2.3 Storm On YARN 304
10.3内存计算框架Spark 307
10.3.1 Spark编程模型 308
10.3.2 Spark基本架构 312
10.3.3 Spark On YARN 316
10.3.4 Spark/Storm On YARN比较 317
10.4小结 317
第四部分 高级篇 320
第11章Facebook Corona剖析 320
11.1概述 320
11.1.1 Corona的基本架构 320
11.1.2 Corona的RPC协议与序列化框架 322
11.2 Corona设计特点 323
11.2.1推式网络通信模型 323
11.2.2基于Hadoop 0.20版本 324
11.2.3使用Thrift 324
11.2.4深度集成Fair Scheduler 324
11.3工作流程介绍 324
11.3.1作业提交 325
11.3.2资源申请与任务启动 326
11.4主要模块介绍 327
11.4.1 ClusterManager 327
11.4.2 CoronaJobTracker 330
11.4.3 CoronaTaskTracker 333
11.5小结 335
第12章Apache Mesos剖析 336
12.1概述 336
12.2底层网络通信库 337
12.2.1 libprocess基本架构 338
12.2.2一个简单示例 338
12.3 Mesos服务 340
12.3.1 SchedulerProcess 341
12.3.2 Mesos Master 342
12.3.3 Mesos Slave 343
12.3.4 ExecutorProcess 343
12.4 Mesos工作流程 344
12.4.1框架注册过程 344
12.4.2 Framework Executor注册过程 345
12.4.3资源分配到任务运行过程 345
12.4.4任务启动过程 347
12.4.5任务状态更新过程 347
12.5 Mesos资源分配策略 348
12.5.1 Mesos资源分配框架 349
12.5.2 Mesos资源分配算法 349
12.6 Mesos容错机制 350
12.6.1 Mesos Master容错 350
12.6.2 Mesos Slave容错 351
12.7 Mesos应用实例 352
12.7.1 Hadoop On Mesos 352
12.7.2 Storm On Mesos 353
12.8 Mesos与YARN对比 354
12.9小结 355
第13章YARN总结与发展趋势 356
13.1资源管理系统设计动机 356
13.2资源管理系统架构演化 357
13.2.1集中式架构 357
13.2.2双层调度架构 358
13.2.3共享状态架构 358
13.3 YARN发展趋势 359
13.3.1 YARN自身的完善 359
13.3.2以YARN为核心的生态系统 361
13.3.3 YARN周边工具的完善 363
13.4小结 363
附录A YARN安装指南 364
附录B YARN配置参数介绍 367
附录C Hadoop Shell命令介绍 371
附录D参考资料 374
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《数字影视特效制作技法解析》王文瑞著 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《计算机组成原理解题参考 第7版》张基温 2017
- 《高等院校保险学专业系列教材 保险学原理与实务》林佳依责任编辑;(中国)牟晓伟,李彤宇 2019
- 《2019国家医师资格考试用书 中医执业助理医师资格考试全真模拟试卷与解析 第3版》国家医师资格考试研究组 2019
- 《刑法归责原理的规范化展开》陈璇著 2019
- 《教师教育系列教材 心理学原理与应用 第2版 视频版》郑红,倪嘉波,刘亨荣编;陈冬梅责编 2020
- 《储望华钢琴作品演奏解析》陈国红著 2019
- 《单片机原理及应用》庄友谊 2020
- 《守四方》贺贵成著 2019
- 《教师怎样说理才有效》李进成著 2019
- 《网络成瘾心理学》胡耿丹,许全成著 2019
- 《风生水起》张品成著 2019
- 《大厨请到家 拉花咖啡 1》都基成著 2017
- 《高情商交际法则》郎树成著 2019
- 《碳排放转移》孙立成著 2019
- 《图的匹配多项式及其应用》马海成著 2019
- 《理性化之路 商业视角下的非营利组织发展研究》宋程成著 2019
- 《国法与社会惯行 明清时代社会经济史研究》(韩)吴金成著 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019