高性能分布式计算系统开发与实现 基于Hadoop、Scalding和SparkPDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:(印)K. G.斯里尼瓦沙(K. G. Srinivasa),(印)阿尼尔·库马尔·穆帕拉(Anil Kumar Muppalla)著
- 出 版 社:北京:机械工业出版社
- 出版年份:2018
- ISBN:9787111601531
- 页数:234 页
第一部分 高性能分布式计算编程基础 2
第1章 引言 2
1.1 分布式系统 2
1.2 分布式系统类型 5
1.2.1 分布式嵌入式系统 5
1.2.2 分布式信息系统 7
1.2.3 分布式计算系统 8
1.3 分布式计算架构 9
1.4 分布式文件系统 10
1.4.1 分布式文件系统需求 10
1.4.2 分布式文件系统架构 11
1.5 分布式系统面临的挑战 13
1.6 分布式系统的发展趋势 16
1.7 高性能分布式计算系统示例 18
参考文献 20
第2章 Hadoop入门 22
2.1 Hadoop简介 22
2.2 Hadoop生态系统 24
2.3 Hadoop分布式文件系统 26
2.3.1 HDFS的特性 26
2.3.2 名称节点和数据节点 27
2.3.3 文件系统 28
2.3.4 数据复制 28
2.3.5 通信 30
2.3.6 数据组织 30
2.4 MapReduce准备工作 31
2.5 安装前的准备 33
2.6 单节点集群的安装 35
2.7 多节点集群的安装 38
2.8 Hadoop编程 45
2.9 Hadoop流 48
参考文献 51
第3章 Spark入门 53
3.1 Spark简介 53
3.2 Spark内部结构 54
3.3 Spark安装 58
3.3.1 安装前的准备 58
3.3.2 开始使用 60
3.3.3 示例:Scala应用 63
3.3.4 Python下Spark的使用 65
3.3.5 示例:Python应用 67
3.4 Spark部署 68
3.4.1 应用提交 68
3.4.2 单机模式 70
参考文献 72
第4章 Scalding和Spark的内部编程 74
4.1 Scalding简介 74
4.1.1 安装 74
4.1.2 编程指南 77
4.2 Spark编程指南 103
参考文献 120
第二部分 使用Hadoop、Scalding和Spark的案例研究 122
第5章 案例研究Ⅰ:使用Scalding和Spark进行数据聚类 122
5.1 简介 122
5.2 聚类 122
5.2.1 聚类方法 123
5.2.2 聚类处理 125
5.2.3 K均值算法 125
5.2.4 简单的K均值示例 126
5.3 实现 128
问题 142
参考文献 142
第6章 案例研究Ⅱ:使用Scalding和Spark进行数据分类 144
6.1 分类 145
6.2 概率论 146
6.2.1 随机变量 146
6.2.2 分布 146
6.2.3 均值和方差 147
6.3 朴素贝叶斯 148
6.3.1 概率模型 148
6.3.2 参数估计和事件模型 149
6.3.3 示例 150
6.4 朴素贝叶斯分类器的实现 152
6.4.1 Scalding实现 153
6.4.2 结果 166
问题 168
参考文献 168
第7章 案例研究Ⅲ:使用Scalding和Spark进行回归分析 169
7.1 回归分析的步骤 169
7.2 实现细节 172
7.2.1 线性回归:代数方法 173
7.2.2 代数方法的Scalding实现 174
7.2.3 代数方法的Spark实现 179
7.2.4 线性回归:梯度下降法 184
7.2.5 梯度下降法的Scalding实现 187
7.2.6 梯度下降法的Spark实现 195
问题 198
参考文献 199
第8章 案例研究Ⅳ:使用Scalding和Spark实现推荐系统 200
8.1 推荐系统 200
8.1.1 目标 201
8.1.2 推荐系统的数据源 201
8.1.3 推荐系统中使用的技术 202
8.2 实现细节 204
8.2.1 Spark实现 206
8.2.2 Scalding实现 221
问题 230
参考文献 230
索引 233
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《联吡啶基钌光敏染料的结构与性能的理论研究》李明霞 2019
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《计算机辅助平面设计》吴轶博主编 2019
- 《计算机组成原理解题参考 第7版》张基温 2017
- 《云计算节能与资源调度》彭俊杰主编 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Helmholtz方程的步进计算方法研究》李鹏著 2019
- 《计算机组成原理 第2版》任国林 2018
- 《生命拍卖》(英)安杰拉·马森斯(AngelaMarsons)著,博集天卷出品 2019
- 《红与黑》(法)斯丹达尔著;郭宏安译 2019
- 《成为自己 找回生命本来的样子》(印)克里希那穆提,司哲 2018
- 《量子系统的非平衡多体理论》(意)G.斯蒂芬尼茨,(德)R.冯·莱文 2019
- 《园丁集 2019》冰心译;(印)拉宾德拉纳特·泰戈尔 2019
- 《卡塞尔不欢迎逻辑》(西)恩里克·比拉-马塔斯著;施杰李,雪菲译 2019
- 《玛德琳》(美)路德维格·贝梅尔曼斯文图 2019
- 《爷爷您还好吗》魏琳琳译;(美)琳达·斯卡科 2019
- 《超图解中国哲学简史》玮丽斯责任编辑;(中国)王宇琨,董志道 2019
- 《大脑与精神简史 我们如何得知如何感受如何思考》王柄燚译;(德国)马提亚斯·埃科尔特 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019