当前位置:首页 > 工业技术
Cassandra权威指南
Cassandra权威指南

Cassandra权威指南PDF电子书下载

工业技术

  • 电子书积分:11 积分如何计算积分?
  • 作 者:(美)休伊特著;王旭译
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2011
  • ISBN:9787115258540
  • 页数:280 页
图书介绍:Cassandra是一种开源的分布式存储系统。书中介绍了它无中心架构、高可用、无缝扩展等特点,讲述了如何安装、配置Cassandra,它的客户端,以及对它监控、维护和性能调优的手段。
《Cassandra权威指南》目录
标签:权威 指南

第1章Cassandra概况 1

1.1关系型数据库有什么问题 1

1.2关系型数据库简单回顾 5

1.2.1 RDBMS:出类拔萃与表现平平 6

1.2.2互联网的规模 12

1.3 Cassandra的电梯间演讲 13

1.3.150个字介绍Cassandra 13

1.3.2分布式与无中心 13

1.3.3弹性可扩展 14

1.3.4高可用与容错 15

1.3.5可调节的一致性 15

1.3.6 Brewer的CAP理论 18

1.3.7面向行 21

1.3.8无schema 22

1.3.9高性能 22

1.4 Cassandra来自何方 22

1.5 Cassandra的应用场景 23

1.5.1大规模部署 23

1.5.2写密集、统计和分析型工作 24

1.5.3地区分布 24

1.5.4变化的应用 24

1.6谁在使用 Cassandra 24

1.7小结 26

第2章 安装Cassandra 27

2.1安装二进制包 27

2.1.1解压缩 27

2.1.2里面有什么 27

2.2从源码编译 28

2.2.1其他编译目标 30

2.2.2使用Maven编译 30

2.3运行Cassandra 30

2.3.1在Windows平台上运行Cassandra 31

2.3.2在Linux下运行Cassandra 31

2.3.3启动服务器 32

2.4使用命令行界面的客户端 33

2.5基本命令行命令 34

2.5.1帮助 34

2.5.2连接服务器 35

2.5.3描述环境 35

2.5.4创建keyspace和列族 36

2.5.5读写数据 37

2.6小结 38

第3章Cassandra的数据模型 39

3.1关系型数据模型 39

3.2简介 40

3.3集群 43

3.4 keyspace 43

3.5列族 44

3.6列 46

3.6.1宽行与窄行 48

3.6.2列的排序 49

3.7超级列 50

3.8 Cassandra与RDBMS的设计差别 53

3.8.1没有查询语言 53

3.8.2没有引用完整性 53

3.8.3第二索引 53

3.8.4排序成为一种设计决策 54

3.8.5反范式化 54

3.9设计模式 55

3.9.1具体化视图 56

3.9.2无值列 56

3.9.3聚合键 56

3.10需要记住的几件事 57

3.11小结 57

第4章 应用实例 59

4.1数据模型设计 59

4.2酒店应用的关系型数据库设计 60

4.3酒店应用的Cassandra设计 61

4.4酒店应用代码 62

4.4.1创建数据库 63

4.4.2数据结构 64

4.4.3进行连接 65

4.4.4预装填数据库 66

4.4.5搜索应用 78

4.5 Twissandra 82

4.6小结 82

第5章Cassandra的架构 83

5.1 system keyspace 83

5.2对等结构 84

5.3 gossip与故障检测 84

5.4逆熵与读修复 86

5.5 memtable、SSTable和commit log 87

5.6提示移交 89

5.7压紧 89

5.8 Bloom filter 91

5.9墓碑 91

5.10分阶段事件驱动架构 92

5.11管理器与服务 93

5.11.1 Cassandra守护进程 93

5.11.2存储服务 93

5.11.3消息服务 93

5.11.4提示移交管理器 94

5.12小结 94

第6章 配置Cassandra 95

6.1 keyspace 95

6.1.1创建列族 98

6.1.2从0.6迁移到0.7 99

6.2副本 99

6.3副本放置策略 100

6.3.1简单策略 101

6.3.2旧网络拓扑策略 102

6.3.3网络拓扑策略 103

6.4副本因子 103

6.5分区器 105

6.5.1随机分区器 106

6.5.2有序分区器 106

6.5.3配页有序分区器 107

6.5.4字节序分区器 107

6.6 Snitch 107

6.6.1 Simple Snitch 107

6.6.2 Property FileSnitch 107

6.7创建集群 108

6.7.1修改集群名称 109

6.7.2给集群增加节点 109

6.7.3多种子节点 111

6.8动态加入环 113

6.9安全 114

6.9.1使用SimpleAuthenticator 114

6.9.2编程鉴权 117

6.9.3使用MD5加密 118

6.9.4提供你自己的鉴权算法 118

6.10杂项设置 119

6.11附加工具 120

6.11.1查看键值 120

6.11.2导入之前版本的配置 120

6.12小结 122

第7章 读写数据 123

7.1 Cassandra与RDBMS查询的不同 123

7.1.1没有Update查询 123

7.1.2 记录级的写原子性 123

7.1.3不支持服务端事务 123

7.1.4没有重复键值 124

7.2写操作的基本属性 124

7.3一致性级别 124

7.4读操作的基本属性 126

7.5 API 126

7.6设置与插入数据 128

7.7使用简单的get 133

7.8数据准备 135

7.9切片谓词 135

7.9.1使用get slice读取特定列名 136

7.9.2通过切片区间获取一组列 137

7.9.3取出一行中的所有列 138

7.10 get range_slices 138

7.11 multiget slice 140

7.12删除 142

7.13批量变更 144

7.13.1批量删除 144

7.13.2区间鬼影 145

7.14编程定义keyspace和列族 145

7.15小结 146

第8章 客户端 147

8.1基本的客户端API 148

8.2 Thrift 148

8.2.1 Thrift对Java的支持 151

8.2.2异常 151

8.2.3 Thrift小结 152

8.3 Avro 152

8.3.1 Avro Ant目标 154

8.3.2 Avro规范 155

8.3.3 Avro小结 156

8.4 Git简介 156

8.5连接客户端节点 157

8.5.1客户端列表 157

8.5.2循环DNS 157

8.5.3负载均衡器 157

8.6 Cassandra Web控制台 157

8.7 Hector(Java) 161

8.7.1特性 161

8.7.2 Hector API 162

8.8 HectorSharp(C#) 162

8.9 Chirper 167

8.10 Chiton(Python) 167

8.11 Pelops(Java) 168

8.12 Kundera(Java ORM) 169

8.13 Fauna(Ruby) 169

8.14小结 170

第9章 监控 171

9.1日志 171

9.1.1跟踪查看 173

9.1.2通用技巧 174

9.2 JMX与MBean概述 175

9.2.1MBean 177

9.2.2集成JMX 179

9.3通过JMX与Cassandra交互 180

9.4 Cassandra的MBean 181

9.4.1org.apache.cassandra.concurrent 185

9.4.2org.apache.cassandra.db 185

9.4.3org.apache.cassandra.gms 186

9.4.4org.apache.cassandra.service 186

9.5定制Cassandra的MBean 188

9.6运行时分析工具 190

9.6.1使用JMX和JHAT进行堆分析 191

9.6.2发现线程问题 194

9.7健康检查 195

9.8小结 196

第10章 维护 197

10.1获取环的信息 198

10.1.1Info 198

10.1.2Ring 198

102获取统计信息 199

10.2.1使用cfstats 199

10.2.2使用tpstats 200

10.3基本维护工作 201

10.3.1修复 201

10.3.2刷写 202

10.3.3清理 203

10.4快照 203

10.4.1进行快照 203

10.4.2清除快照 204

10.5对集群进行负载均衡 205

10.6退服节点 208

10.7更新节点 210

10.7.1删除令牌 210

10.7.2压紧阈值 210

10.7.3在一个工作的集群中改变列族 210

10.8小结 211

第11章 性能调优 213

11.1数据存储 213

11.2回复超时 215

11.3 commit log 215

11.4 memtable 216

11.5并发 216

11.6缓存 217

11.7缓冲区尺寸 218

11.8使用Python压力测试 218

11.8.1生成Python Thrift接口 218

11.8.2运行Python压力测试 220

11.9启动和JVM设置 222

11.10小结 224

第12章 集成Hadoop 225

12.1何为Hadoop 225

12.2使用MapReduce 226

12.3运行字数统计例子 227

12.3.1将数据输出到Cassandra 229

12.3.2 Hadoop流 229

12.4 MapReduce之上的工具 229

12.4.1 Pig 230

12.4.2 Hive 231

12.5集群配置 231

12.6案例 233

12.6.1 Raptr.com:Keith Thornhill 233

12.6.2 Imagini:Dave Gardner 233

12.7小结 234

附录 非关系型数据库大观 235

词汇表 261

关于作者 279

关于封面 279

返回顶部