《数据密集型应用系统设计》PDF下载

  • 购买积分:16 如何计算积分?
  • 作  者:(美)马丁·科勒普曼(Martin Kleppmann)著;赵军平,吕云松,耿煜,李三平
  • 出 版 社:北京:中国电力出版社
  • 出版年份:2018
  • ISBN:9787519821968
  • 页数:525 页
图书介绍:本书内容详实而富有实际指导价值,本书作者将带你纵览各种数据处理和存储技术,探讨背后的优劣与取舍之道。软件应用虽有千般变化,却终有若干原则贯穿其中。通过本书,软件开发者和架构师将学到如何将这些原则用于实践,如何在最新应用架构中充分发挥数据的威力。本书主要内容有:深入探索常用分布式系统内部机制,学习如何高效运用这些技术。分析各种工具的优势和不足,帮助做出明智的设计决策。解析一致性、扩展性、容错和复杂度之间的权衡利弊。介绍分布式系统研究的最新进展(现代数据库的基石)。揭示主流在线服务的基本架构。

前言 1

第一部分 数据系统基础 11

第1章 可靠、可扩展与可维护的应用系统 11

认识数据系统 12

可靠性 14

可扩展性 18

可维护性 25

小结 28

第2章 数据模型与查询语言 33

关系模型与文档模型 34

数据查询语言 46

图状数据模型 52

小结 65

第3章 数据存储与检索 71

数据库核心:数据结构 72

事务处理与分析处理 89

列式存储 94

小结 101

第4章 数据编码与演化 109

数据编码格式 110

数据流模式 124

小结 134

第二部分 分布式数据系统 145

第5章 数据复制 145

主节点与从节点 146

复制滞后问题 154

多主节点复制 160

无主节点复制 168

小结 181

第6章 数据分区 189

数据分区与数据复制 190

键-值数据的分区 190

分区与二级索引 195

分区再平衡 198

请求路由 202

小结 204

第7章 事务 211

深入理解事务 212

弱隔离级别 221

串行化 237

小结 250

第8章 分布式系统的挑战 259

故障与部分失效 260

不可靠的网络 262

不可靠的时钟 271

知识,真相与谎言 282

小结 292

第9章 一致性与共识 303

一致性保证 304

可线性化 305

顺序保证 319

分布式事务与共识 330

小结 349

第三部分 派生数据 367

第10章 批处理系统 367

使用UNIX工具进行批处理 368

MapReduce与分布式文件系统 375

超越MapReduce 394

小结 403

第11章 流处理系统 413

发送事件流 414

数据库与流 424

流处理 435

小结 449

第12章 数据系统的未来 461

数据集成 461

分拆数据库 469

端到端的正确性 484

做正确的事情 500

小结 509

术语表 521