HBase实战PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:(美)NickDimidukAmandeepKhurana著
- 出 版 社:北京:人民邮电出版社
- 出版年份:2013
- ISBN:7115324467
- 页数:315 页
第一部分 HBase基础 3
第1章 HBase介绍 3
1.1数据管理系统:速成 4
1.1.1你好,大数据 5
1.1.2数据创新 6
1.1.3 HBase的崛起 7
1.2 HBase使用场景和成功案例 8
1.2.1典型互联网搜索问题:BigTable发明的原因 8
1.2.2抓取增量数据 9
1.2.3内容服务 12
1.2.4信息交换 13
1.3你好HBase 14
1.3.1快速安装 14
1.3.2 HBase Shell命令行交互 16
1.3.3存储数据 17
1.4小结 18
第2章 入门 20
2.1从头开始 21
2.1.1创建表 21
2.1.2检查表模式 22
2.1.3建立连接 22
2.1.4连接管理 23
2.2数据操作 23
2.2.1存储数据 24
2.2.2修改数据 25
2.2.3工作机制:HBase写路径 25
2.2.4读数据 26
2.2.5工作机制:HBase读路径 27
2.2.6删除数据 28
2.2.7合并:HBase的后台工作 28
2.2.8有时间版本的数据 29
2.2.9数据模型概括 30
2.3数据坐标 31
2.4小结 33
2.5数据模型 37
2.5.1逻辑模型:有序映射的映射集合 37
2.5.2物理模型:面向列族 39
2.6表扫描 40
2.6.1设计用于扫描的表 41
2.6.2执行扫描 42
2.6.3扫描器缓存 43
2.6.4使用过滤器 43
2.7原子操作 44
2.8 ACID语义 45
2.9小结 46
第3章 分布式的HBase、 HDFS和MapReduce 48
3.1 一个MapReduce的例子 49
3.1.1延迟与吞吐量 49
3.1.2串行计算吞吐量有限 50
3.1.3并行计算提高吞吐量 50
3.1.4 MapReduce:用布式计算最大化吞吐量 51
3.2 Hadoop MapReduce概览 52
3.2.1 MapReduce数据流介绍 53
3.2.2 MapReduce内部机制 57
3.3分布式模式的HBase 58
3.3.1切分和分配大表 58
3.3.2如何找到region 61
3.3.3如何找到-ROOT-表 62
3.4 HBase和MapReduce 64
3.4.1使用HBase作为数据源 64
3.4.2使用HBase接收数据 66
3.4.3使用HBase共享资源 67
3.5信息汇总 71
3.5.1编写MapReduce应用 72
3.5.2运行MapReduce应用 73
3.6大规模条件下的可用性和可靠性 74
3.6.1 HDFS作为底层存储 75
3.7小结 77
第二部分 高级概念 81
第4章 HBase表设计 81
4.1如何开始模式设计 82
4.1.1问题建模 82
4.1.2需求定义:提前多做准备工作总是有好处的 84
4.1.3均衡分布数据和负载的建模方法 87
4.1.4目标数据访问 93
4.2反规范化是HBase世界里的词语 95
4.3相同表里的混杂数据 97
4.4行键设计策略 98
4.5 IO考虑 99
4.5.1为写优化 99
4.5.2为读优化 101
4.5.3基数和行键结构 101
4.6从关系型到非关系型 102
4.6.1一些基本概念 103
4.6.2嵌套实体 105
4.6.3没有映射到的一些东西 106
4.7列族高级配置 107
4.7.1可配置的数据块大小 107
4.7.2数据块缓存 108
4.7.3激进缓存 108
4.7.4布隆过滤器 108
4.7.5生存时间(TTL) 109
4.7.6压缩 110
4.7.7单元时间版本 110
4.8过滤数据 111
4.8.1实现一个过滤器 113
4.8.2预装过滤器 115
4.9小结 118
第5章 使用协处理器扩展HBase 120
5.1两种协处理器 121
5.1.1 Observer协处理器 121
5.1.2 endpoint协处理器 123
5.2实现一个observer 124
5.2.1修改模式 124
5.2.2从HBase开始 126
5.2.3安装observer 128
5.2.4其他安装选项 130
5.3实现一个endpoint 131
5.3.1为endpoint定义接口 131
5.3.2实现endpoint服务器 132
5.3.3实现endpoint客户端 133
5.3.4部署endpoint服务器 135
5.3.5试运行 136
5.4小结 136
第6章 其他的HBase客户端选择 137
6.1在UNIX里使用HBasehell脚本 138
6.1.1准备HBase Shell 138
6.1.2使用UNIX Shell脚本创建表模式 139
6.2使用JRuby进行HBase Shell编程 141
6.2.1准备HBase Shell 141
6.2.2访问TwitBase的users表 142
6.3通过REST访问HBase 144
6.3.1启动HBase REST 服务 145
6.3.2访问TwitBase的users表 146
6.4通过Python使用HBaseThrift网关 149
6.4.1生成Python语言的HBaseThrift客户端库 151
6.4.2启动HBase Thrift服务 152
6.4.3扫描TwitBaseuser表 153
6.5 asynchbase:另外一种HBase Java客户端 156
6.5.1创建一个asynchbase项目 157
6.5.2改变TwitBase的密码策略 159
6.5.3试运行 171
6.6小结 172
第三部分 应用系统实例 175
第7章 通过实例学习HBase:OpenTSDB 175
7.1 OpenTSDB概述 176
7.1.1挑战:基础设施监控 177
7.1.2数据:时间序列 178
7.1.3存储:HBase 179
7.2设计一个HBase应用系统 180
7.2.1模式设计 180
7.2.2应用架构 184
7.3实现一个HBase应用系统 187
7.3.1存储数据 187
7.3.2查询数据 192
7.4小结 196
第8章 在HBase上查询地理信息系统 197
8.1运用地理数据 197
8.2设计一个空间索引 199
8.2.1从复合行键开始 201
8.2.2介绍geohash 202
8.2.3理解geohash 205
8.2.4在有空间感知特性的行键里使用geohash 206
8.3实现最近邻居查询 210
8.4把计算工作推往服务器端 215
8.4.1基于查询多边形创建一次geohash扫描 217
8.4.2区域内查询第一幕:客户端 222
8.4.3区域内查询第二幕:WithinFilter 224
8.5小结 228
第四部 分让HBase运转来 233
第9章 部署HBase 233
9.1规划集群 234
9.1.1原型集群 235
9.1.2 小型生产集群(10~20台服务器) 235
9.1.3中型生产集群(50台以下服务器) 236
9.1.4大型生产集群(超过50台服务器) 237
9.1.5 Hadoop Master节点 237
9.1.6 HBase Master 238
9.1.7 Hadoop DataNode和HBase RegionServer 238
9.1.8 ZooKeeper 239
9.1.9采用云服务怎么样? 240
9.2部署软件 242
9.2.1 Whirr:在云端部署 242
9.3发行版本 244
9.3.1使用原生Apache发行版本 244
9.3.2使用Cloudera的CDH发行版本 245
9.4配置 246
9.4.1 HBase配置 246
9.4.2与HBase有关的Hadoop配置参数 252
9.4.3操作系统配置 253
9.5管理守护进程 254
9.6小结 255
第10章 运维 256
10.1监控你的集群 257
10.1.1 HBase如何输出监控指标 257
10.1.2收集监控指标和图形展示 258
10.1.3 HBase输出的监控指标 260
10.1.4应用端监控 264
10.2 HBase集群的性能 265
10.2.1性能测试 265
10.2.2什么影响了HBase的性能 268
10.2.3优化支撑系统 269
10.2.4优化HBase 270
10.3集群管理 274
10.3.1启动和停止HBase 274
10.3.2优雅停止和让节点退役 275
10.3.3增加节点 276
10.3.4滚动重启和升级 276
10.3.5 bin/hbase和Hbase Shell 277
10.3.6维护一致性——hbck 283
10.3.7查看HFile和HLog 286
10.3.8预先拆分表 288
10.4备份和复制 290
10.4.1集群间复制 290
10.4.2使用MapReduce作业进行备份 294
10.4.3备份根目录 298
10.5小结 299
附录A探索HBase系统 300
附录B更多关于HDFS的工作原理 307
- 《Maya 2018完全实战技术手册》来阳编著 2019
- 《Python3从入门到实战》董洪伟 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《星空摄影后期实战》阿五在路上著 2020
- 《半小时漫画股票实战法》财经杂质著 2019
- 《深度学习与飞桨PaddlePaddle Fluid实战》于祥 2019
- 《数字插画实战 人像创作30例》王鲁光著 2019
- 《2017国家执业药师资格考试 全考点实战通关必备 中药学综合知识与技能 第3版》国家执业药师资格考试命题研究专家组 2017
- 《微软Azure实战参考》李竞,陈勇华编著 2019
- 《Cocos Creator微信小游戏开发实战》王绍明编著 2020
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《看漫画学钢琴 技巧 3》高宁译;(日)川崎美雪 2019
- 《优势谈判 15周年经典版》(美)罗杰·道森 2018
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《海明威书信集:1917-1961 下》(美)海明威(Ernest Hemingway)著;潘小松译 2019
- 《迁徙 默温自选诗集 上》(美)W.S.默温著;伽禾译 2020
- 《上帝的孤独者 下 托马斯·沃尔夫短篇小说集》(美)托马斯·沃尔夫著;刘积源译 2017
- 《巴黎永远没个完》(美)海明威著 2017
- 《剑桥国际英语写作教程 段落写作》(美)吉尔·辛格尔顿(Jill Shingleton)编著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《办好人民满意的教育 全国教育满意度调查报告》(中国)中国教育科学研究院 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《人民院士》吴娜著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《中国人民的心》杨朔著;夕琳编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中华人民共和国成立70周年优秀文学作品精选 短篇小说卷 上 全2册》贺邵俊主编 2019
- 《指向核心素养 北京十一学校名师教学设计 数学 九年级 上 配人教版》周志英总主编 2019
- 《中华人民共和国成立70周年优秀文学作品精选 中篇小说卷 下 全3册》洪治纲主编 2019