Hadoop技术内幕 深入解析Hadoop Common和HDFS架构设计与实现原理PDF电子书下载
- 电子书积分:16 积分如何计算积分?
- 作 者:蔡斌,陈湘萍著
- 出 版 社:北京:机械工业出版社
- 出版年份:2013
- ISBN:9787111417668
- 页数:512 页
第一部分 环境准备 2
第1章 源代码环境准备 2
1.1什么是Hadoop 2
1.1.1 Hadoop简史 2
1.1.2 Hadoop的优势 3
1.1.3 Hadoop生态系统 4
1.2准备源代码阅读环境 8
1.2.1安装与配置JDK 8
1.2.2安装Eclipse 9
1.2.3安装辅助工具Ant 12
1.2.4安装类UNIX Shell环境Cygwin 13
1.3准备Hadoop源代码 15
1.3.1下载Hadoop 15
1.3.2创建Eclipse项目 16
1.3.3 Hadoop源代码组织 18
1.4小结 19
第二部分 Common的实现 22
第2章Hadoop配置信息处理 22
2.1配置文件简介 22
2.1.1 Windows操作系统的配置文件 22
2.1.2 Java配置文件 23
2.2 Hadoop Configuration详解 24
2.2.1 Hadoop配置文件的格式 24
2.2.2 Configuration的成员变量 26
2.2.3资源加载 27
2.2.4使用get 和set 访问/设置配置项 32
2.3 Configurable接口 34
2.4小结 35
第3章 序列化与压缩 36
3.1序列化 36
3.1.1 Java内建序列化机制 36
3.1.2 Hadoop序列化机制 38
3.1.3 Hadoop序列化机制的特征 39
3.1.4 Hadoop Writable机制 39
3.1.5典型的Writable类详解 41
3.1.6 Hadoop序列化框架 48
3.2压缩 49
3.2.1 Hadoop压缩简介 50
3.2.2 Hadoop压缩API应用实例 51
3.2.3 Hadoop压缩框架 52
3.2.4 Java本地方法 61
3.2.5支持Snappy压缩 65
3.3小结 69
第4章Hadoop远程过程调用 70
4.1远程过程调用基础知识 70
4.1.1 RPC原理 70
4.1.2 RPC机制的实现 72
4.1.3 Java远程方法调用 73
4.2 Java动态代理 78
4.2.1创建代理接口 78
4.2.2调用转发 80
4.2.3动态代理实例 81
4.3 Java NIO 84
4.3.1 Java基本套接字 84
4.3.2 Java NIO基础 86
4.3.3 Java NIO实例:回显服务器 93
4.4 Hadoop中的远程过程调用 96
4.4.1利用Hadoop IPC构建简单的分布式系统 96
4.4.2 Hadoop IPC的代码结构 100
4.5 Hadoop IPC连接相关过程 104
4.5.1 IPC连接成员变量 104
4.5.2建立IP C连接 106
4.5.3数据分帧和读写 111
4.5.4维护IPC连接 114
4.5.5关闭IPC连接 116
4.6 Hadoop IPC方法调用相关过程 118
4.6.1 Java接口与接口体 119
4.6.2 IPC方法调用成员变量 121
4.6.3客户端方法调用过程 123
4.6.4服务器端方法调用过程 126
4.7 Hadoop IPC上的其他辅助过程 135
4.7.1 RPC.getProxy()和RPC.stopProxy() 136
4.7.2 RPC.getServer()和Server的启停 138
4.8小结 141
第5章Hadoop文件系统 142
5.1文件系统 142
5.1.1文件系统的用户界面 142
5.1.2文件系统的实现 145
5.1.3文件系统的保护控制 147
5.2 Linux文件系统 150
5.2.1 Linux本地文件系统 150
5.2.2虚拟文件系统 153
5.2.3 Linux文件保护机制 154
5.2.4 Linux文件系统API 155
5.3分布式文件系统 159
5.3.1分布式文件系统的特性 159
5.3.2基本NFS体系结构 160
5.3.3 NFS支持的文件操作 160
5.4 Java文件系统 162
5.4.1 Java文件系统API 162
5.4.2 URI和URL 164
5.4.3 Java输入/输出流 166
5.4.4随机存取文件 169
5.5 Hadoop抽象文件系统 170
5.5.1 Hadoop文件系统API 170
5.5.2 Hadoop输入/输出流 175
5.5.3 Hadoop文件系统中的权限 179
5.5.4抽象文件系统中的静态方法 180
5.5.5 Hadoop文件系统中的协议处理器 184
5.6 Hadoop具体文件系统 188
5.6.1 FileSystem层次结构 189
5.6.2 RawLocalFileSystem的实现 191
5.6.3 Checksum File System的实现 196
5.6.4 RawInMemoryFileSystem的实现 210
5.7小结 213
第三部分 Hadoop分布式文件系统 216
第6章HDFS概述 216
6.1初识HDFS 216
6.1.1 HDFS主要特性 216
6.1.2 HDFS体系结构 217
6.1.3 HDFS源代码结构 221
6.2基于远程过程调用的接口 223
6.2.1与客户端相关的接口 224
6.2.2 HDFS各服务器间的接口 236
6.3非远程过程调用接口 244
6.3.1数据节点上的非IPC接口 245
6.3.2名字节点和第二名字节点上的非IPC接口 252
6.4 HDFS主要流程 254
6.4.1客户端到名字节点的文件与目录操作 254
6.4.2客户端读文件 256
6.4.3客户端写文件 257
6.4.4数据节点的启动和心跳 258
6.4.5第二名字节点合并元数据 259
6.5小结 261
第7章 数据节点实现 263
7.1数据块存储 263
7.1.1数据节&点的磁盘目录文件结构 263
7.1.2数据节点存储的实现 266
7.1.3数据节点升级 269
7.1.4文件系统数据集的工作机制 276
7.2流式接口的实现 285
7.2.1 DataXceiverServer和DataXceiver 286
7.2.2读数据 289
7.2.3写数据 298
7.2.4数据块替换、数据块拷贝和读数据块检验信息 313
7.3作为整体的数据节点 314
7.3.1数据节点和名字节点的交互 314
7.3.2数据块扫描器 319
7.3.3数据节点的启停 321
7.4小结 326
第8章 名字节点实现 327
8.1文件系统的目录树 327
8.1.1从i-node到INode 327
8.1.2命名空间镜像和编辑日志 333
8.1.3第二名字节点 351
8.1.4 FSDirectory的实现 361
8.2数据块和数据节点管理 365
8.2.1数据结构 366
8.2.2数据节点管理 378
8.2.3数据块管理 392
8.3远程接口ClientProtocol的实现 412
8.3.1文件和目录相关事务 412
8.3.2读数据使用的方法 415
8.3.3写数据使用的方法 419
8.3.4工具dfsadmin依赖的方法 443
8.4名字节点的启动和停止 444
8.4.1安全模式 444
8.4.2名字节点的启动 449
8.4.3名字节点的停止 454
8.5小结 454
第9章HDFS客户端 455
9.1认识DFSClient 455
9.1.1 DFSClient的构造和关闭 455
9.1.2文件和目录、系统管理相关事务 457
9.1.3删除HDFS文件/目录的流程 459
9.2输入流 461
9.2.1读数据前的准备:打开文件 463
9.2.2读数据 465
9.2.3关闭输入流 475
9.2.4读取HDFS文件数据的流程 475
9.3输出流 478
9.3.1写数据前的准备:创建文件 481
9.3.2写数据:数据流管道的建立 482
9.3.3写数据:数据包的发送 486
9.3.4写数据:数据流管道出错处理 493
9.3.5写数据:租约更新 496
9.3.6写数据:DFSOutputStream&sync()的作用 497
9.3.7关闭输出流 499
9.3.8向HDFS文件写入数据的流程 500
9.4 DistributedFileSystem的实现 506
9.5 HDFS常用工具 508
9.5.1 FsShell 508
9.5.2 DFSAdmin 510
9.6小结 511
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《数字影视特效制作技法解析》王文瑞著 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《计算机组成原理解题参考 第7版》张基温 2017
- 《高等院校保险学专业系列教材 保险学原理与实务》林佳依责任编辑;(中国)牟晓伟,李彤宇 2019
- 《2019国家医师资格考试用书 中医执业助理医师资格考试全真模拟试卷与解析 第3版》国家医师资格考试研究组 2019
- 《刑法归责原理的规范化展开》陈璇著 2019
- 《教师教育系列教材 心理学原理与应用 第2版 视频版》郑红,倪嘉波,刘亨荣编;陈冬梅责编 2020
- 《储望华钢琴作品演奏解析》陈国红著 2019
- 《单片机原理及应用》庄友谊 2020
- 《中学历史教师素养研究》李漱萍著 2019
- 《图像与神话》刘惠萍著 2019
- 《社会保障预算、精算与核算》王晓军,李静萍著 2019
- 《城市垃圾治理中的公众参与研究》张莉萍著 2019
- 《图书馆管理策略与阅读服务创新研究》袁萍著 2020
- 《近五百年黄土高原的环境扰动与社会变迁》张萍著 2019
- 《英语阅读教学与写作研究》汪艳萍著 2017
- 《怪物考 中世纪幻想艺术图文志 典藏版》王慧萍著 2018
- 《林徽因传 时光深处的倩影》杨祯萍著 2018
- 《西北非中心城市高校青年教师教学发展研究》邱艳萍著 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019