序 1
前言 3
第一部分 HBase概述 11
第1章 什么是HBase 11
面向列与面向行 13
实现和使用示例 13
第2章 HBase原理 15
表格式列族 15
表的内部操作 22
依赖 27
HBase角色 27
第3章 HBase生态系统 32
监控工具 32
SQL 40
框架 42
第4章 HBase规模预估和调优概述 45
硬件 46
存储 46
网络 47
操作系统调优 48
Hadoop调优 49
HBase调优 50
负载不均调优 52
第5章 环境设置 54
系统要求 55
HBase单机安装 58
虚拟机中的HBase 61
本地与VM 62
故障排除 63
第一步 65
伪分布式模式和全分布式模式 73
第二部分 用例 77
第6章 用例:HBase作为一个记录系统 77
摄取/预处理 78
处理/服务 79
用户体验 84
第7章 底层存储引擎的实现 87
表设计 87
数据转换 92
HFile校验 98
批量加载 99
数据索引 104
数据检索 107
更进一步 109
第8章 用例:近实时事件处理 111
摄取/预处理 114
近实时事件处理 115
处理/服务 116
第9章 近实时实现事件处理 119
应用流 121
实施 125
进一步 144
第10章 用例:HBase作为主数据管理工具 145
摄取 146
处理 148
第11章 主数据管理工具HBase的实现 150
MapReduce与Spark 150
Spark与HBase交互 151
Spark结合HBase实现 152
进一步 162
第12章 用例:文档存储 163
数据服务 165
数据摄取 166
清理 168
第13章 文档存储的实现 169
MOB 169
数据一致性 174
进一步 175
第三部分 疑难问题的定位和排错 179
第14章 region过多 179
后果 179
原因 180
解决方案 181
防范 188
第15章 列族过多 191
后果 192
原因、解决方案和预防 193
第16章 热点 196
后果 196
原因 196
防范和解决方案 200
第17章 超时和垃圾回收 201
后果 201
原因 203
解决方案 205
预防 205
第18章 HBCK和不一致 210
HBase文件系统布局 210
查看META表 211
在HDFS上查看HBase 212
HBCK概述 214
使用HBCK 215