《Learning HBase中文版》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:(印)谢帕夫著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2015
  • ISBN:9787121270727
  • 页数:249 页
图书介绍:本书是一本介绍HBase知识的专业书籍,它系统地介绍了HBase的基本概念,与传统关系数据库的功能和特点的对比,自身的配置方法以及安装方法,同时深入介绍了HBase的运维管理和故障处理。本书还介绍了基于HBase的Java编程方法,以及HBase作为大数据工具的一些使用案例,这些足以帮助读者更好地理解HBase的架构,更顺利地在自己的项目中使用HBase。

第1章 了解HBase生态系统 1

基于Hadoop的HBase架构 2

RDBMS和HBase的架构对比 3

HBase的特征 3

HBase在Hadoop 生态系统中的位置 4

HBase中的数据表示 5

Hadoop 6

HBase与关系型数据库的功能对比 8

行存储数据库的逻辑展现 9

列存储数据库的逻辑展现 9

HBase的内部存储架构 11

开始使用HBase 11

HBase是何时出现的 11

HBase的组件和功能 14

ZooKeeper 14

谁在用HBase?为什么要用? 19

什么时候考虑使用HBase? 20

什么时候不使用H Base? 21

了解一些开源的HBase工具 21

Hadoop和HBase版本兼容性对照表 22

HBase的应用 23

HBase的优点和缺点 24

小结 25

第2章 开启HBase之旅 26

深入理解HBase的组件 27

HFile 27

Region 27

可扩展性——理解纵向扩展和横向扩展的过程 29

读写周期 32

Write-Ahead Logs 33

MemStore 33

HBase内部管理 34

合并 34

Region分裂 35

Region分配 36

Region合并 37

RegionServer故障转移 37

HBase的删除请求 37

读写周期 37

可用的HBase发行版本列表 38

HBase的必备条件和容量规划 39

DNS正向解析 39

DNS反向解析 40

SSH 41

小结 45

第3章 搭建HBase 46

在Ubuntu上下载Java 46

主机配置 52

基于主机文件 52

基于命令 52

基于文件 52

基于DNS 54

安装和配置SSH 54

在Ubuntu/Red Hat/CentOS上安装SSH 55

配置SSH 55

安装和配置NTP 56

容量规划 57

安装和配置Hadoop 58

core-site.xml 63

hdfs-site.xml 63

yarn-site.xml 65

mapred-site.xml 66

hadoop-env.sh 67

yarn-env.sh 67

Hadoop的启动步骤 67

配置Apache HBase 69

在单机模式中配置HBase 69

在分布式模式中配置HBase 70

安装和配置ZooKeeper 74

安装Cloudera版本的Hadoop和HBase 76

下载RPM包 76

简易安装Cloudera 77

安装Hadoop和MapReduce包 77

在Windows上安装Hadoop 78

小结 81

第4章 优化HBase/Hadoop集群 82

Hadoop/HB ase集群的类型 82

CDH集群的推荐配置 84

容量规划 85

优化Hadoop 86

通用优化技巧 86

优化Java GC 86

优化Linux操作系统 87

优化Hadoop参数 87

优化MapReduce 88

优化HBase 91

Hadoop 91

内存 93

Java 93

操作系统 94

HBase 94

优化ZooKeeper 96

Hadoop中的重要配置文件 96

HBase中的重要配置文件 97

小结 98

第5章 HBase的存储、框架以及数据类型 99

HBase的数据类型 100

HBase中的数据存储—— 逻辑视图vs.真实物理视图 101

命名空间 102

HBase服务 103

行键(Row key) 104

列族(Column family) 104

列(Column) 104

单元格(Cell) 104

版本(Version) 104

时间戳(Timestamp) 105

数据模型的操作 105

读(Get) 105

写(Put) 106

扫描(Scan) 106

删除(Delete) 106

版本和原因 107

决定版本数量 108

版本的下界 108

版本的上界 108

模式设计 109

表类型的设计 113

短宽和高瘦设计模式的好处 114

复合键设计 115

在HBase中计算存储的数据大小 118

小结 119

第6章 HBase集群运维与故障处理 120

Hadoop shell命令 121

Hadoop shell命令的类型 121

HBase shell命令 140

HBase管理工具 149

hbck —— HBase检查 149

HBase健康检查脚本 151

写HBase shell脚本 151

使用Hadoop工具或者JAR 151

用Hive连接HBase 153

HBase region管理 155

压缩 155

合并 155

HBase节点管理 155

服役 155

退役 156

实现安全性 157

安全访问 157

Kerberos KDC 157

客户端的安全配置 158

服务器端的安全配置 159

简单的安全 160

客户端配置 161

标签的安全特性 162

HBase的访问控制 163

使用标签的单元格访问 168

配置ZooKeeper安全 169

HBase常见错误的故障排查和相关说明 170

集群失败的可能情况 171

监控HBase的健康状况 172

小结 175

第7章 HBase脚本编程 176

HBase中的备份与恢复技术 176

离线备份/full-shutdown备份 177

在线备份 178

Windows上的HBase 185

在HBase中进行脚本编程 185

.irbrc文件 187

获取时间戳 188

开启调试 189

在HBase中开启SQL 189

参与HBase 190

小结 190

第8章 HBase Java编程 191

准备开发环境 192

构建Java客户端程序 192

数据类型 196

数据模型的Java操作 196

读操作 196

写操作 204

修改操作 206

HBase过滤器 208

过滤器类型 209

客户端API 214

小结 215

第9章 HBase Java高级编程 216

接口、类和异常 216

管理任务编程 218

数据操作代码 224

MapReduce和HBase 226

RESTful和Thrift服务接口 231

RESTful服务接口 231

Thrift服务接口 232

HDFS编程 233

高级主题简介 237

协处理器 237

布隆过滤器 238

Lily项目 238

小结 239

第10章 HBase使用案例 240

HBase在当今行业中的作用 240

HBase和关系型数据库的未来的对比 241

一些现实世界中的工程使用案例 241

HB ase在Facebook 241

HBase在Pinterest 243

HBase在Groupon 244

HBase在LongTail Video 246

HBase在Aadhaar (UIDAI) 247

有用的链接和参考 248

小结 249