《HBase不睡觉书》PDF下载

  • 购买积分:14 如何计算积分?
  • 作  者:杨曦著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2018
  • ISBN:9787302490555
  • 页数:403 页
图书介绍:这是一本既感性又严谨的书。本书共分为10章,由浅入深的讲解HBase概念、安装、配置、部署。让读者对Hbase先有一个感性认识,再从应用角度,介绍了高级用法、监控和性能调优。既兼顾了初学者也适用于想要深入学习Hbase的读者。

第1章 初识HBase 1

1.1海量数据与NoSQL 1

1.1.1关系型数据库的极限 1

1.1.2 CAP理论 1

1.1.3 NoSQL 2

1.2 HBase是怎么来的 3

1.3为什么要用HBase 3

1.4你必须懂的基本概念 4

1.4.1部署架构 4

1.4.2存储架构 7

1.4.3跟关系型数据库的对比 9

第2章 让HBase跑起来 11

2.1本书测试环境 12

2.2配置服务器名 12

2.3配置SSH免密登录 13

2.4安装Hadoop 15

2.4.1安装Hadoop单机模式 15

2.4.2安装Hadoop集群模式 20

2.4.3 ZooKeeper 23

2.4.4配置Hadoop HA 27

2.4.5让Hadoop可以开机自启动 35

2.4.6最终配置文件 41

2.5安装HBase 43

2.5.1单机模式 45

2.5.2伪分布式模式 47

2.5.3关于ZooKeeper不得不说的事 51

2.5.4完全分布式模式 52

2.5.5 HBase Web控制台(UI) 58

2.5.6让HBase可以开机自启动 58

2.5.7启用数据块编码(可选) 60

2.5.8启用压缩器(可选) 65

2.5.9数据块编码还是压缩器(可选) 70

第3章 HBase基本操作 71

3.1 hbase shell的使用 71

3.1.1用create命令建表 72

3.1.2用list命令来查看库中有哪些表 73

3.1.3用describe命令来查看表属性 73

3.1.4用put命令来插入数据 74

3.1.5用scan来查看表数据 76

3.1.6用get来获取单元格数据 77

3.1.7用delete来删除数据 77

3.1.8用deleteall删除整行记录 79

3.1.9用disable来停用表 80

3.1.10用drop来删除表 80

3.1.11 shell命令列表 81

3.2使用Hue来查看HBase数据 121

3.2.1准备工作 121

3.2.2安装Hue 124

3.2.3配置Hue 127

3.2.4使用Hue来查看HBase 132

第4章 客户端API入门 134

4.1 10分钟教程 134

4.2 30分钟教程 141

4.3 CRUD一个也不能少 147

4.3.1 HTable类和Table接口 147

4.3.2 put方法 148

4.3.3 append方法 155

4.3.4 increment方法 157

4.3.5 get方法 158

4.3.6 exists方法 162

4.3.7 delete方法 162

4.3.8 mutation方法 164

4.4批量操作 166

4.4.1批量put操作 167

4.4.2批量get操作 167

4.4.3批量delete操作 168

4.5 BufferedMutator(可选) 168

4.6 Scan扫描 170

4.6.1用法 170

4.6.2缓存 173

4.7 HBase支持什么数据格式 174

4.8总结 175

第5章 HBase内部探险 176

5.1数据模型 176

5.2 HBase是怎么存储数据的 178

5.2.1宏观架构 178

5.2.2预写日志 181

5.2.3 MemStore 183

5.2.4 HFile 184

5.2.5 KeyValue类 186

5.2.6增删查改的真正面目 186

5.2.7数据单元层次图 187

5.3一个KeyValue的历险 187

5.3.1写入 188

5.3.2读出 188

5.4 Region的定位 189

第6章 客户端API的高阶用法 193

6.1过滤器 193

6.1.1过滤器快速入门 194

6.1.2比较运算快速入门 198

6.1.3分页过滤器 201

6.1.4过滤器列表 203

6.1.5行键过滤器 208

6.1.6列过滤器 214

6.1.7单元格过滤器 227

6.1.8装饰过滤器 228

6.1.9自定义过滤器 231

6.1.10如何在hbase shell中使用过滤器 248

6.2协处理器 249

6.2.1协处理器家族 249

6.2.2快速入门 251

6.2.3如何加载 254

6.2.4协处理器核心类 256

6.2.5观察者 259

6.2.6终端程序 276

第7章 客户端API的管理功能 290

7.1列族管理 290

7.2表管理 296

7.3 Region管理 299

7.4快照管理 304

7.5维护工具管理 307

7.5.1均衡器 307

7.5.2规整器 308

7.5.3目录管理器 310

7.6集群状态以及负载(ClusterStatus & ServerLoad) 311

7.7 Admin的其他方法 315

7.8可见性标签管理 319

7.8.1快速入门 321

7.8.2可用标签 328

7.8.3用户标签 329

7.8.4单元格标签 329

第8章 再快一点 331

8.1 Master和RegionServer的JVM调优 331

8.1.1先调大堆内存 331

8.1.2可怕的Full GC 333

8.1.3 Memstore的专属JVM策略MSLAB 335

8.2 Region的拆分 340

8.2.1 Region的自动拆分 341

8.2.2 Region的预拆分 345

8.2.3 Region的强制拆分 347

8.2.4推荐方案 347

8.2.5总结 347

8.3 Region的合并 348

8.3.1通过Merge类合并Region 348

8.3.2热合并 348

8.4 WAL的优化 349

8.5 BlockCache的优化 351

8.5.1 LRUBlockCache 352

8.5.2 SlabCacbe 353

8.5.3 BucketCache 354

8.5.4组合模式 356

8.5.5总结 357

8.6 Memstore的优化 357

8.6.1读写中的Memstore 358

8.6.2 Memstore的刷写 358

8.6.3总结 361

8.7 HFile的合并 361

8.7.1合并的策略 361

8.7.2 compaction的吞吐量限制参数 374

8.7.3合并的时候HBase做了什么 377

8.7.4 Major Compaction 378

8.7.5总结 380

8.8诊断手册 380

8.8.1阻塞急救 380

8.8.2朱丽叶暂停 381

8.8.3读取性能调优 384

8.8.4案例分析 385

第9章 当HBase遇上MapReduce 389

9.1为什么要用MapReduce 389

9.2快速入门 389

9.3慢速入门:编写自己的MapReduce 391

9.3.1准备数据 391

9.3.2新建项目 392

9.3.3建立MapReduce类 393

9.3.4建立驱动类 396

9.3.5打包、部署、运行 400

9.4相关类介绍 402

9.4.1 TableMapper 402

9.4.2 TableReducer 403

9.4.3 TableMapReduceUtil 403