当前位置:首页 > 工业技术
Spark Streaming技术内幕及源码剖析
Spark Streaming技术内幕及源码剖析

Spark Streaming技术内幕及源码剖析PDF电子书下载

工业技术

  • 电子书积分:11 积分如何计算积分?
  • 作 者:王家林,夏阳编著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2017
  • ISBN:9787302464914
  • 页数:251 页
图书介绍:本书根据大数据处理引擎Spark的最新版本,从应用案例、原理、源码、流程、调优等多个角度剖析Spark上的实时计算框架Spark Streaming。在勾勒出Spark Streaming架构轮廓的基础上,从基本源码开始进行剖析,由浅入深地引导已具有Spark基础技术知识的读者进行Spark Streaming的进阶学习,理解Spark Streaming的原理和运行机制,为流数据处理的决策和应用提供了技术参考。
《Spark Streaming技术内幕及源码剖析》目录

第1章Spark Streaming应用概述 1

1.1 Spark Streaming应用案例 2

1.2 Spark Streaming应用剖析 13

第2章Spark Streaming基本原理 15

2.1 Spark Core简介 16

2.2 Spark Streaming设计思想 26

2.3 Spark Streaming整体架构 30

2.4编程接口 33

第3章Spark Streaming运行流程详解 39

3.1从StreamingContext的初始化到启动 40

3.2数据接收 54

3.3数据处理 91

3.4数据清理 115

3.5容错机制 127

3.5.1容错原理 128

3.5.2 Driver容错机制 152

3.5.3 Executor容错机制 161

3.6 No Receiver方式 167

3.7输出不重复 175

3.8消费速率的动态控制 176

3.9状态操作 189

3.10窗口操作 212

3.11页面展示 216

3.12 Spark Streaming应用程序的停止 227

第4章Spark Streaming性能调优机制 237

4.1并行度解析 238

4.1.1数据接收的并行度 238

4.1.2数据处理的并行度 240

4.2内存 240

4.3序列化 240

4.4 Batch Interval 241

4.5 Task 242

4.6 JVM GC 242

第5章Spark 2.0中的流计算 245

5.1连续应用程序 246

5.2无边界表unbounded table 248

5.3增量输出模式 249

5.4 API简化 250

5.5其他改进 250

相关图书
作者其它书籍
返回顶部