《HBase应用架构》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:(美)吉恩-马克·斯帕加里(Jean-Marc Spaggiari)
  • 出 版 社:北京:中国电力出版社
  • 出版年份:2017
  • ISBN:9787519811211
  • 页数:217 页
图书介绍:本书提供了简单的解决方案和代码示例来帮助你实现自己的用例,包括本主数据管理(MDM)和文件系统以及准实时事件处理。你也能够学习到故障排除的方法来帮助你避免一般部署时出现的问题。本书的主要内容有:学习HBase能用来做什么,其生态系统包括哪些组件以及如何构建你的环境。探索现实世界中HBase实例如何部署并投入生产环境。检验用于追踪监控索赔的记录用例,并诊断数据管理以及产品质量。理解HBase如何和Spark、kafka、MapReduce,以及Java API一起使用。学习如何识别最常见的HBase issue 原因,并理解其结果。

序 1

前言 3

第一部分 HBase概述 11

第1章 什么是HBase 11

面向列与面向行 13

实现和使用示例 13

第2章 HBase原理 15

表格式列族 15

表的内部操作 22

依赖 27

HBase角色 27

第3章 HBase生态系统 32

监控工具 32

SQL 40

框架 42

第4章 HBase规模预估和调优概述 45

硬件 46

存储 46

网络 47

操作系统调优 48

Hadoop调优 49

HBase调优 50

负载不均调优 52

第5章 环境设置 54

系统要求 55

HBase单机安装 58

虚拟机中的HBase 61

本地与VM 62

故障排除 63

第一步 65

伪分布式模式和全分布式模式 73

第二部分 用例 77

第6章 用例:HBase作为一个记录系统 77

摄取/预处理 78

处理/服务 79

用户体验 84

第7章 底层存储引擎的实现 87

表设计 87

数据转换 92

HFile校验 98

批量加载 99

数据索引 104

数据检索 107

更进一步 109

第8章 用例:近实时事件处理 111

摄取/预处理 114

近实时事件处理 115

处理/服务 116

第9章 近实时实现事件处理 119

应用流 121

实施 125

进一步 144

第10章 用例:HBase作为主数据管理工具 145

摄取 146

处理 148

第11章 主数据管理工具HBase的实现 150

MapReduce与Spark 150

Spark与HBase交互 151

Spark结合HBase实现 152

进一步 162

第12章 用例:文档存储 163

数据服务 165

数据摄取 166

清理 168

第13章 文档存储的实现 169

MOB 169

数据一致性 174

进一步 175

第三部分 疑难问题的定位和排错 179

第14章 region过多 179

后果 179

原因 180

解决方案 181

防范 188

第15章 列族过多 191

后果 192

原因、解决方案和预防 193

第16章 热点 196

后果 196

原因 196

防范和解决方案 200

第17章 超时和垃圾回收 201

后果 201

原因 203

解决方案 205

预防 205

第18章 HBCK和不一致 210

HBase文件系统布局 210

查看META表 211

在HDFS上查看HBase 212

HBCK概述 214

使用HBCK 215