大数据挑战与NoSQL数据库技术PDF电子书下载
- 电子书积分:14 积分如何计算积分?
- 作 者:陆嘉恒编著
- 出 版 社:北京:电子工业出版社
- 出版年份:2013
- ISBN:9787121196607
- 页数:424 页
第1章 概论 1
1.1 引子 2
1.2 大数据挑战 3
1.3 大数据的存储和管理 5
1.3.1 并行数据库 5
1.3.2 NoSQL数据管理系统 6
1.3.3 NewSQL数据管理系统 8
1.3.4 云数据管理 11
1.4 大数据的处理和分析 11
1.5 小结 13
参考文献 13
理论篇 16
第2章 数据一致性理论 16
2.1 CAP理论 17
2.2 数据一致性模型 21
2.3 ACID与BASE 22
2.4 数据一致性实现技术 23
2.4.1 Quorum系统NRW策略 23
2.4.2 两阶段提交协议 24
2.4.3 时间戳策略 27
2.4.4 Paxos 30
2.4.5 向量时钟 38
2.5 小结 43
参考文献 43
第3章 数据存储模型 45
3.1 总论 46
3.2 键值存储 48
3.2.1 Redis 49
3.2.2 Dynamo 49
3.3 列式存储 50
3.3.1 Bigtable 51
3.3.2 Cassandra与HBase 51
3.4 文档存储 52
3.4.1 MongoDB 53
3.4.2 CouchDB 53
3.5 图形存储 54
3.5.1 Neo4j 55
3.5.2 GraphDB 56
3.6 小、结 56
参考文献 56
第4章 数据分区与放置策略 58
4.1 分区的意义 59
4.1.1 为什么要分区 59
4.1.2 分区的优点 60
4.2 范围分区 61
4.3 列表分区 62
4.4 哈希分区 63
4.5 三种分区的比较 64
4.6 放置策略 64
4.6.1 一致性哈希算法 65
4.6.2 容错性与可扩展性分析 66
4.6.3 虚拟节点 68
4.7 小结 69
参考文献 69
第5章 海量数据处理方法 70
5.1 MapReduce简介 71
5.2 MapReduce数据流 72
5.3 MapReduce数据处理 75
5.3.1 提交作业 76
5.3.2 初始化作业 78
5.3.3 分配任务 78
5.3.4 执行任务 79
5.3.5 更新任务执行进度和状态 80
5.3.6 完成作业 81
5.4 Dryad简介 81
5.4.1 DFS Cosmos介绍 82
5.4.2 Dryad执行引擎 84
5.4.3 DryadLINQ解释引擎 86
5.4.4 DryadLINQ编程 88
5.5 Dryad数据处理步骤 90
5.6 MapReduce vs Dryad 92
5.7 小结 94
参考文献 95
第6章 数据复制与容错技术 96
6.1 海量数据复制的作用和代价 97
6.2 海量数据复制的策略 97
6.2.1 Dynamo的复制策略 97
6.2.2 CouchDB的复制策略 99
6.2.3 PNUTS的复制策略 99
6.3 海量数据的故障发现与处理 101
6.3.1 Dynamo的故障发现与处理 101
6.3.2 CouchDB的故障发现与处理 103
6.3.3 PNUTS的故障发现与处理 103
6.4 小结 104
参考文献 104
第7章 数据压缩技术 105
7.1 数据压缩原理 106
7.1.1 数据压缩的定义 106
7.1.2 数据为什么可以压缩 107
7.1.3 数据压缩分类 107
7.2 传统压缩技术[1] 108
7.2.1 霍夫曼编码 108
7.2.2 LZ77算法 109
7.3 海量数据带来的3V挑战 112
7.4 Oracle混合列压缩 113
7.4.1 仓库压缩 114
7.4.2 存档压缩 114
7.5 Google数据压缩技术 115
7.5.1 寻找长的重复串 115
7.5.2 压缩算法 116
7.6 Hadoop压缩技术 118
7.6.1 LZO简介 118
7.6.2 LZO原理[5] 119
7.7 小结 121
参考文献 121
第8章 缓存技术 122
8.1 分布式缓存简介 123
8.1.1 分布式缓存的产生 123
8.1.2 分布式缓存的应用 123
8.1.3 分布式缓存的性能 125
8.1.4 衡量可用性的标准 125
8.2 分布式缓存的内部机制 125
8.2.1 生命期机制 126
8.2.2 一致性机制 126
8.2.3 直读与直写机制 129
8.2.4 查询机制 130
8.2.5 事件触发机制 130
8.3 分布式缓存的拓扑结构 130
8.3.1 复制式拓扑 131
8.3.2 分割式拓扑 131
8.3.3 客户端缓存拓扑 131
8.4 小结 132
参考文献 132
系统篇 134
第9章 key-value数据库 134
9.1 key-value模型综述 134
9.2 Redis 135
9.2.1 Redis概述 135
9.2.2 Redis下载与安装 135
9.2.3 Redis入门操作 136
9.2.4 Redis在业内的应用 143
9.3 Voldemort 143
9.3.1 Voldemort概述 143
9.3.2 Voldemort下载与安装 144
9.3.3 Voldemort配置 145
9.3.4 Voldemort开发介绍[3] 147
9.4 小结 149
参考文献 149
第10章 Column-Oriented数据库 150
10.1 Column-Oriented数据库简介 151
10.2 Bigtable数据库 151
10.2.1 Bigtable数据库简介 151
10.2.2 Bigtable数据模型 152
10.2.3 Bigtable基础架构 154
10.3 Hypertable数据库 157
10.3.1 Hypertable简介 157
10.3.2 Hypertable安装 157
10.3.3 Hypertable架构 163
10.3.4 Hypertable中的基本概念和原理 164
10.3.5 Hyperable的查询 168
10.4 Cassandra数据库 175
10.4.1 Cassandra简介 175
10.4.2 Cassandra配置 175
10.4.3 Cassandra数据库的连接 177
10.4.4 Cassandra集群机制 180
10.4.5 Cassandra的读/写机制 182
10.5 小结 183
参考文献 183
第11章 文档数据库 185
11.1 文档数据库简介 186
11.2 CouchDB数据库 186
11.2.1 CouchDB简介 186
11.2.2 CouchDB安装 188
11.2.3 CouchDB入门 189
11.2.4 CouchDB查询 200
11.2.5 CouchDB的存储结构 207
11.2.6 SQL和CouchDB 209
11.2.7 分布式环境中的CouchDB 210
11.3 MongoDB数据库 211
11.3.1 MongoDB简介 211
11.3.2 MongoDB的安装 212
11.3.3 MongoDB入门 215
11.3.4 MongoDB索引 224
11.3.5 SQL与MongoDB 226
11.3.6 MapReduce与MongoDB 229
11.3.7 MongoDB与CouchDB对比 234
11.4 小结 236
参考文献 237
第12章 图存数据库 238
12.1 图存数据库的由来及基本概念 239
12.1.1 图存数据库的由来 239
12.1.2 图存数据库的基本概念 239
12.2 Neo4j图存数据库 240
12.2.1 Neo4j简介 240
12.2.2 Neo4i使用教程 241
12.2.3 分布式Neo4j——Neo4j HA 251
12.2.4 Neo4j工作机制及优缺点浅析 256
12.3 GraphDB 258
12.3.1 GraphDB简介 258
12.3.2 GraphDB的整体架构 260
12.3.3 GraphDB的数据模型 264
12.3.4 GraphDB的安装 266
12.3.5 GraphDB的使用 268
12.4 OrientDB 276
12.4.1 背景 276
12.4.2 OrientDB是什么 276
12.4.3 OrientDB的原理及相关技术 277
12.4.4 Windows下OrientDB的安装与使用 282
12.4.5 相关Web应用 286
12.5 三种图存数据库的比较 288
12.5.1 特征矩阵 288
12.5.2 分布式模式及应用比较 289
12.6 小结 289
参考文献 290
第13章 基于Hadoop的数据管理系统 291
13.1 Hadoop简介 292
13.2 HBase 293
13.2.1 HBase体系结构 293
13.2.2 HBase数据模型 297
13.2.3 HBase的安装和使用 298
13.2.4 HBase与RDBMS 303
13.3 Pig 304
13.3.1 Pigr的安装和使用 304
13.3.2 Pig Latin语言 306
13.3.3 Pig实例 311
13.4 Hive 315
13.4.1 Hive的数据存储 316
13.4.2 Hive的元数据存储 316
13.4.3 安装Hive 317
13.4.4 HiveQL简介 318
13.4.5 Hive的网络接口(WebUI) 328
13.4.6 Hive的JDBC接口 328
13.5 小结 330
参考文献 331
第14章 NewSQL数据库 332
14.1 NewSQL数据库简介 333
14.2 MySQL Cluster 333
14.2.1 概述 334
14.2.2 MySQL Cluster的层次结构 336
14.2.3 MySQL Cluster的优势和应用 337
14.2.4 海量数据处理中的sharding技术 339
14.2.5 单机环境下MySQL Cluster的安装 343
14.2.6 MySQL Cluster的分布式安装与配置指导 348
14.3 VoltDB 350
14.3.1 传统关系数据库与VoltDB 351
14.3.2 VoltDB的安装与配置 351
14.3.3 VoltDB组件 354
14 3 4 Hello World 355
14.3.5 使用Generate脚本 361
14.3.6 Eclipse集成开发 362
14.4 小结 365
参考文献 365
第15章 分布式缓存系统 366
15.1 Memcached缓存技术 367
15.1.1 背景介绍 367
15.1.2 Memcached缓存技术的特点 368
15.1.3 Memcached安装[3] 374
15.1.4 Memcached中的数据操作 375
15.1.5 Memcached的使用 376
15.2 Microsoft Velocity分布式缓存系统 378
15.2.1 Microsoft Velocity简介 378
15.2.2 数据分类 379
15.2.3 Velocity核心概念 380
15.2.4 Velocity安装 382
15.2.5 一个简单的Velocity客户端应用 385
15.2.6 扩展型和可用性 387
15.3 小结 388
参考文献 388
应用篇 392
第16章 企业应用 392
16.1 Instagram 393
16.1.1 Instagram如何应对数据的急剧增长 395
16.1.2 Instagram的数据分片策略 398
16.2 Facebook对Hadoop以及HBase的应用 400
16.2.1 工作负载类型 401
16.2.2 为什么采用Apache Hadoop和HBase 403
16.2.3 实时HDFS 405
16.2.4 Hadoop HBase的实现 409
16.3 淘宝大数据解决之道 411
16.3.1 淘宝数据分析 412
16.3.2 淘宝大数据挑战 413
16.3.3 淘宝OceanBase数据库 414
16.3.4 淘宝将来的工作 422
16.4 小结 423
参考文献 423
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《Prometheus技术秘笈》百里燊 2019
- 《中央财政支持提升专业服务产业发展能力项目水利工程专业课程建设成果 设施农业工程技术》赵英编 2018
- 《药剂学实验操作技术》刘芳,高森主编 2019
- 《林下养蜂技术》罗文华,黄勇,刘佳霖主编 2017
- 《脱硝运行技术1000问》朱国宇编 2019
- 《催化剂制备过程技术》韩勇责任编辑;(中国)张继光 2019
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《电子测量与仪器》人力资源和社会保障部教材办公室组织编写 2009
- 《少儿电子琴入门教程 双色图解版》灌木文化 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《通信电子电路原理及仿真设计》叶建芳 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《电子应用技术项目教程 第3版》王彰云 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017