当前位置:首页 > 工业技术
HBase管理指南
HBase管理指南

HBase管理指南PDF电子书下载

工业技术

  • 电子书积分:11 积分如何计算积分?
  • 作 者:(日)蒋燚峰著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2013
  • ISBN:9787115319814
  • 页数:297 页
图书介绍:本书是一部实用性的操作指南,它首先会讲解如何建立一个完全分布式的HBase集群以及如何将数据移到该集群中。你还会学到如何使用各种工具来完成日常管理工作,以及有效地管理和监控集群,以使集群达到最佳的性能。
《HBase管理指南》目录
标签:指南 管理

第1章 HBase集群安装 1

1.1简介 1

1.2快速入门 3

1.3 Amazon EC2的安装及准备 7

1.4安装Hadoop 12

1.5 ZooKeeper安装 17

1.6修改内核参数设置 20

1.7 HBase安装 22

1.8 Hadoop/ZooKeeper/HBase基本配置 26

1.9安装多个高可用性(HA)的主节点 29

第2章 数据迁移 42

2.1简介 42

2.2通过客户端程序导入MySQL数据 43

2.3使用批量加载工具导入TSV文件的数据 49

2.4编写自定义MapReduce任务来导入数据 55

2.5在数据移入HBase前预创建区域 61

第3章 使用管理工具 65

3.1简介 65

3.2 HBase主Web界面 66

3.3使用HBase Shell管理表 69

3.4使用HBase Shell访问HBase中的数据 72

3.5使用HBase Shell管理集群 76

3.6在HBase Shell中执行Java方法 80

3.7行计数器 82

3.8 WAL工具——手动分割和转储WAL 85

3.9 HFile工具——以文本方式查看HFile的内容 90

3.10 HBase hbck——检查HBase集群的一致性 93

3.11 HBase Hive——使用类SQL语言查询HBase中的数据 96

第4章 HBase数据备份及恢复 104

4.1简介 104

4.2使用distcp进行关机全备份 105

4.3使用CopyTable在表问复制数据 110

4.4将HBase表导出为HDFS上的转储文件 113

4.5通过从HDFS导入转储文件来恢复HBase数据 117

4.6备份NameNode元数据 120

4.7备份区域开始键 124

4.8集群复制 127

第5章 监控与诊断 133

5.1简介 133

5.2显示HBase表的磁盘利用率 134

5.3安装Ganglia来监控HBase集群 136

5.4 OpenTSDB——使用HBase监控HBase集群 143

5.5安装Nagios来监控HBase进程 151

5.6使用Nagios检查Hadoop/HBase日志 158

5.7使用一些简单脚本来报告集群状态 164

5.8热点区域——诊断写操作 168

第6章 维护和安全 173

6.1简介 173

6.2启用HBase RPC的DEBUG级日志功能 174

6.3平稳节点停机 177

6.4为集群添加节点 180

6.5滚动重启 182

6.6管理HBase进程的简单脚本 186

6.7简化部署的简单脚本 189

6.8对Hadoop和HBase进行Kerberos身份认证 191

6.9配置HDFS使用Kerberos安全保护机制 196

6.10 HBase的安全保护配置 205

第7章 故障排查 210

7.1简介 210

7.2故障排查工具介绍 211

7.3处理XceiverCount错误 216

7.4处理“打开的文件过多”的错误 217

7.5处理“无法创建新本地线程”错误 219

7.6处理“HBase忽略了HDFS的客户端配置”问题 221

7.7处理ZooKeeper客户端的连接错误 223

7.8处理ZooKeeper会话过期错误 225

7.9处理EC2上HBase的启动错误 228

第8章 基本性能调整 237

8.1简介 237

8.2设置Hadoop分散磁盘I/O 239

8.3使用网络拓扑结构脚本使Hadoop可感知机架 241

8.4以noatime和nodiratime方式装载磁盘 244

8.5将vm.swappiness设为0以避免交换 246

8.6 Java GC和HBase堆的设置 248

8.7使用压缩 252

8.8管理合并 255

8.9管理区域分割 257

第9章 高级配置和调整 261

9.1简介 261

9.2使用YCSB对HBase集群进行基准测试 262

9.3增加区域服务器的处理线程数 270

9.4使用自定义算法预创建区域 271

9.5避免写密集集群中的更新阻塞 277

9.6调节MemStore内存大小 280

9.7低延迟系统的客户端调节 281

9.8配置列族的块缓存 284

9.9调高读密集集群的块缓存大小 287

9.10客户端扫描类的设置 289

9.11调整块大小来提高寻道性能 291

9.12启用Bloom过滤器提高整体吞吐量 293

相关图书
作者其它书籍
返回顶部