第1章 为什么会有Kudu 1
Kudu为什么重要 1
易用性驱动接纳度 2
新的应用场景 5
物联网 5
现有的实时分析方案 7
实时处理 13
硬件环境 15
Kudu在大数据生态中的独特位置 17
与其他生态系统的组件对比 19
与大数据组件对比——HDFS、HBase和Cassandra 24
小结 26
第2章 Kudu简介 27
Kudu的高层设计 29
Kudu中的角色 29
master服务器 31
tablet服务器 32
Kudu中的概念与机制 42
热点 42
分区 44
第3章 安装与运行 49
安装 49
使用Kudu Quickstart VM 49
使用Cloudera Manager 51
从源代码构建 52
软件包 53
Cloudera Quickstart VM 53
快速安装:3分钟或者更短 54
小结 58
第4章 Kudu的管理 59
为Kudu做规划 59
master服务器和tablet服务器 60
预写日志 65
数据服务器和存储 68
复制策略(replication strategy) 69
部署时的注意事项:是采用新集群还是现有集群 70
全新的仅有Kudu的集群 70
全新的包含Kudu的Hadoop集群 71
在现有的Hadoop集群中添加Kudu 77
tablet服务器和master服务器的Web UI 81
master服务器UI和tablet服务器UI 82
master服务器UI 83
tablet服务器UI 83
Kudu命令行接口 84
集群 84
文件系统 86
tablet副本 92
与Raft一致性相关的元数据 106
添加和删除tablet服务器 107
添加tablet服务器 107
删除tablet服务器 108
安全 109
一个简单的类比 110
Kudu的安全功能 112
基本的性能调优 117
Kudu的内存限制 117
维护管理器的线程 118
监控性能 119
未雨绸缪,远离麻烦 119
避免耗尽磁盘空间 119
容忍磁盘故障 120
备份 120
小结 121
第5章 Kudu常用的开发接口 123
客户端API 124
Kudu Client(客户端) 124
Kudu Table 125
Kudu DDL 125
Kudu扫描器(Scanner)读取模式 126
C++ API 127
Python API 130
准备Python开发环境 131
使用Python开发Kudu应用 131
Java 135
Java应用 137
Spark 140
在Impala中使用Kudu 145
第6章 表和模式设计 149
模式设计基础 150
在线事务处理/在线分析处理混合的模式设计 151
Lambda架构 151
OLTP/OLAP拆分 152
主键和列的设计 153
列模式的其他注意事项 154
分区的基础知识 160
范围分区 161
哈希分区 161
模式的更改 162
最佳实践和提示 163
分区 163
大对象 164
decimal(十进制数) 164
不重复的字符串 165
压缩 165
对象的命名 165
列的数量 165
二进制类型 166
网络包示例 166
小结 168
第7章 Kudu用例 169
实时物联网分析 169
预测建模 173
多平台混合方案 176
关于作者 180
封面图片 182