Hadoop虚拟化PDF电子书下载
- 电子书积分:13 积分如何计算积分?
- 作 者:(美)乔治·特鲁希略(George Trujillo),(美)查尔斯·吉姆(Charles Kim),(美)史蒂夫·琼斯(Steve Jones),(美)隆美尔·加西亚(Rommel Garcia),(美)贾斯汀·默里(Justin Murray)著
- 出 版 社:北京:人民邮电出版社
- 出版年份:2019
- ISBN:9787115497543
- 页数:358 页
第1章 了解大数据的世界 1
1.1数据革命 1
1.2传统数据系统 3
1.2.1半结构化和非结构化数据 4
1.2.2因果关系 6
1.2.3数据挑战 6
1.3现代数据架构 14
1.4组织转型 15
1.5行业转型 17
1.6小结 17
第2章 Hadoop基础概念 18
2.1Hadoop中的数据类型 18
2.2使用案例 19
2.3什么是Hadoop 20
2.4 Hadoop发行版本 25
2.5 Hadoop框架 25
2.6 NoSQL数据库 29
2.7 Hadoop集群 33
2.8 Hadoop软件进程 36
2.9 Hadoop生态中的角色 45
2.10小结 48
第3章 YARN和HDFS 49
3.1 Hadoop分布式集群 49
3.2 Hadoop目录结构 53
3.3 Hadoop分布式文件系统 54
3.3.1 YARN日志 56
3.3.2 NameNode 57
3.3.3 DataNode 58
3.3.4块分布 60
3.3.5 NameNode配置和元数据管理 62
3.4机架感知 67
3.4.1块管理 67
3.4.2均衡器 68
3.4.3群集中的数据完整性维护 68
3.4.4配额和垃圾桶 76
3.5 YARN和YARN处理模型 76
3.5.1在YARN上运行应用 83
3.5.2资源调度器 88
3.5.3基准测试 92
3.5.4 TeraSort基准测试组件 94
3.6小结 96
第4章 现代数据平台 98
4.1设计一个Hadoop集群 98
4.2小结 115
第5章 数据提取 117
5.1提取、加载和转化 117
5.1.1 Sqoop:数据移动和SQL源 118
5.1.2 Flume:流数据 123
5.1.3 Oozie:计划和工作流 140
5.1.4 Falcon:数据生命周期管理 145
5.1.5 Kafka:实时数据流 148
5.2小结 156
第6章 Hadoop SQL引擎 157
6.1 SQL的起源 157
6.2 Hadoop中的SQL 158
6.3 Hadoop SQL引擎 159
6.4感受Hive和Pig的乐趣 166
6.4.1 Hive 166
6.4.2 HCatalog 180
6.5小结 187
第7章 Hadoop多租户 188
7.1保障访问 189
7.1.1认证 189
7.1.2审计 194
7.1.3授权 194
7.1.4数据保护 196
7.1.5数据隔离 203
7.1.6进程隔离 211
7.2小结 214
第8章 虚拟化基础 215
8.1 Hadoop虚拟化的原因 216
8.2小结 231
参考文献 231
第9章 Hadoop虚拟化最佳实践 232
9.1有目的、有调理地进行 Hadoop虚拟化 232
9.1.1目的始于明确的目标 234
9.1.2 Hadoop不同层次虚拟化 234
9.1.3行业最佳实践 236
9.2小结 249
第10章 Hadoop虚拟化 250
10.1如何管理Hadoop生态 251
10.1.1构建敏捷和弹性的企业Hadoop平台 252
10.1.2澄清条款 252
10.1.3从裸机到虚拟化的历程 253
10.2为何考虑Hadoop虚拟化 254
10.2.1 Hadoop虚拟化的好处 255
10.2.2虚拟化可以跟本地运行一样快甚至更快 256
10.2.3协调和交叉目的专业化是未来 258
10.2.4障碍可以是在企业之前 259
10.2.5虚拟化不是全部或不是一个选项 259
10.2.6快速配置并提高开发和测试环境质量 259
10.2.7使用虚拟化提升高可用性 261
10.2.8使用虚拟化处理Hadoop工作负载 261
10.2.9基于云的Hadoop 262
10.2.10大数据扩展 262
10.2.11虚拟化的途径 263
10.2.12软件定义数据中心 264
10.2.13虚拟化网络 265
10.2.14 vRealize Suite 266
10.3小结 267
参考文献 268
第11章 Hadoop虚拟化主服务器 269
11.1Hadoop虚拟化集群服务器 269
11.1.1 Hadoop周边环境虚拟化 270
11.1.2 Hadoop主服务器虚拟化 271
11.1.3无SAN虚拟化 274
11.2小结 275
第12章 虚拟化工作节点 276
12.1 Hadoop中的工作节点 276
12.2 Hadoop集群的部署模式 277
12.2.1组合模式 278
12.2.2分离模式 281
12.2.3数据—计算分离的网络影响 283
12.2.4数据—计算分离模式下的共享存储方式 284
12.2.5用于应用临时数据的本地磁盘 286
12.2.6使用网络附加存储(NAS)的共享存储架构模型 286
12.2.7部署模式总结 288
12.3 Hadoop虚拟化工作节点的最佳实践 289
12.4 Hadoop虚拟化扩展 293
12.5小结 296
参考文献 296
资源 297
第13章 私有云中部署Hadoop即服务 298
13.1云概念 298
13.1.1 Hadoop的受益者 299
13.1.2解决方案架构概述 303
13.2小结 305
参考文献 305
第14章 掌握Hadoop的安装 306
14.1为正确的场景使用正确的解决方案 306
14.2配置仓库 308
14.2.1安装HDP2.2 310
14.2.2环境准备 310
14.3设置Hadoop配置 320
14.4启动HDFS和YARN 325
14.4.1启动YARN 327
14.4.2验证MapReduce功能 329
14.5安装和配置Hive 331
14.6安装和配置MySQL数据库 332
14.7安装和配置Hive和HCatalog 332
14.8小结 335
第15章 为Hadoop配置Linux 336
15.1支持的Linux平台 337
15.2不同部署模式 337
15.3 Linux黄金模板 337
15.3.1构建企业级Linux Hadoop平台 338
15.3.2 Linux版本选择 341
15.4最优Linux内核参数和系统设置 341
15.4.1 epoll 341
15.4.2禁用交换空间 342
15.4.3安装过程中的安全性禁用 342
15.4.4 IO调度器调优 344
15.4.5检查透明大内存页面配置 344
15.4.6 Limits.conf 344
15.4.7 RDM分区对齐 345
15.4.8文件系统注意事项 345
15.4.9 XFS惰性计算参数 347
15.4.10 Mount选项 347
15.4.11I/O调度器 348
15.4.12磁盘读写选项 350
15.4.13存储基准测试 350
15.4.14 Java版本 351
15.4.15 设置NTP 351
15.4.16启用巨型帧 352
15.4.17其他网络方面的考虑 353
15.5小结 355
附录Hadoop集群创建:先决条件检查表 356
- 《虚拟流域环境理论技术研究与应用》冶运涛蒋云钟梁犁丽曹引等编著 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《国之重器出版工程 云化虚拟现实技术与应用》熊华平 2019
- 《现代汉语空间位置关系虚拟运动研究》姚京晶著 2018
- 《虚拟现实与人工智能技术的综合应用》潘晓霞著 2018
- 《土家织锦文化数字化保护与虚拟展示技术研究》赵刚著 2019
- 《虚拟现实技术 VR全景实拍基础教程》韩伟 2019
- 《虚拟现实 沉浸于VR梦境》易盛编著 2019
- 《虚拟社群传播》李彪著 2018
- 《深入浅出 Java虚拟机设计与实现》华保健著 2020
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《看漫画学钢琴 技巧 3》高宁译;(日)川崎美雪 2019
- 《优势谈判 15周年经典版》(美)罗杰·道森 2018
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《海明威书信集:1917-1961 下》(美)海明威(Ernest Hemingway)著;潘小松译 2019
- 《迁徙 默温自选诗集 上》(美)W.S.默温著;伽禾译 2020
- 《上帝的孤独者 下 托马斯·沃尔夫短篇小说集》(美)托马斯·沃尔夫著;刘积源译 2017
- 《巴黎永远没个完》(美)海明威著 2017
- 《剑桥国际英语写作教程 段落写作》(美)吉尔·辛格尔顿(Jill Shingleton)编著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《办好人民满意的教育 全国教育满意度调查报告》(中国)中国教育科学研究院 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《人民院士》吴娜著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《中国人民的心》杨朔著;夕琳编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中华人民共和国成立70周年优秀文学作品精选 短篇小说卷 上 全2册》贺邵俊主编 2019
- 《指向核心素养 北京十一学校名师教学设计 数学 九年级 上 配人教版》周志英总主编 2019
- 《中华人民共和国成立70周年优秀文学作品精选 中篇小说卷 下 全3册》洪治纲主编 2019