大数据技术概论 从虚幻走向真实的数据世界PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:娄岩编著;徐东雨参编
- 出 版 社:北京:清华大学出版社
- 出版年份:2017
- ISBN:7302450518
- 页数:196 页
第1章 大数据概论 1
1.1 大数据技术概述 2
1.1.1 大数据的基本概念 2
1.1.2 IT产业的发展简史 3
1.1.3 大数据的来源 5
1.1.4 大数据产生的三个发展阶段 6
1.1.5 大数据的特点 6
1.1.6 大数据处理流程 7
1.1.7 大数据的数据格式特性 8
1.1.8 大数据的特征 8
1.1.9 大数据的应用领域 9
1.2 大数据技术架构 9
1.3 大数据的整体技术和关键技术 10
1.4 大数据分析的五种典型工具简介 13
1.5 大数据未来发展趋势 16
1.5.1 数据资源化 16
1.5.2 数据科学和数据联盟的成立 16
1.5.3 大数据隐私和安全问题 16
1.5.4 开源软件成为推动大数据发展的动力 17
1.5.5 大数据在多方位改善我们的生活 17
本章小结 18
第2章 大数据采集及预处理 19
2.1 大数据采集 20
2.1.1 大数据采集概述 20
2.1.2 大数据采集的数据来源 20
2.1.3 大数据采集的技术方法 22
2.2 大数据的预处理 24
2.3 大数据采集及预处理的工具 31
本章小结 42
第3章 大数据分析概述 44
3.1 大数据分析简介 45
3.1.1 什么是大数据分析 45
3.1.2 大数据分析的基本方法 45
3.1.3 大数据处理流程 47
3.2 大数据分析的主要技术 49
3.2.1 深度学习 49
3.2.2 知识计算 51
3.2.3 可视化 51
3.3 大数据分析处理系统简介 54
3.3.1 批量数据及处理系统 54
3.3.2 流式数据及处理系统 54
3.3.3 交互式数据及处理系统 55
3.3.4 图数据及处理系统 55
3.4 大数据分析的应用 57
本章小结 60
第4章 大数据可视化 62
4.1 大数据可视化概述 62
4.1.1 大数据可视化与数据可视化 63
4.1.2 大数据可视化的过程 64
4.2 大数据可视化工具 69
4.2.1 常见大数据可视化工具简介 70
4.2.2 Tableau数据可视化入门 71
本章小结 79
第5章 Hadoop概论 81
5.1 Hadoop简介 82
5.1.1 Hadoop的发展简史 82
5.1.2 Hadoop应用现状和发展趋势 83
5.2 Hadoop的架构与组成 85
5.2.1 Hadoop架构 85
5.2.2 Hadoop组成模块介绍 86
5.3 Hadoop的应用 89
5.3.1 Hadoop平台搭建 89
5.3.2 Hadoop的开发方式 91
5.3.3 Hadoop应用分析 92
本章小结 93
第6章 HDFS和Common概论 95
6.1 HDFS概述 96
6.1.1 HDFS相关概念 96
6.1.2 HDFS特点 97
6.1.3 HDFS体系结构 98
6.1.4 HDFS工作原理 99
6.1.5 HDFS相关技术 101
6.1.6 HDFS源代码结构 104
6.1.7 HDFS接口 105
6.2 Common概述 106
本章小结 108
第7章 MapReduce概论 110
7.1 MapReduce简介 111
7.1.1 如何理解MapReduce 111
7.1.2 MapReduce功能和技术特征 112
7.2 MapReduce的Map和Reduce任务 114
7.2.1 Map与Reduce 114
7.2.2 Map任务原理 117
7.2.3 Reduce任务原理 118
7.3 MapReduce架构和工作流程 119
7.3.1 MapReduce的架构 119
7.3.2 MapReduce工作流程 120
7.4 MapReduce编程源码范例 120
7.5 MapReduce接口 121
本章小结 122
第8章 NoSQL技术介绍 124
8.1 NoSQL基础知识 126
8.1.1 NoSQL的产生 126
8.1.2 NoSQL的特点 126
8.1.3 NoSQL的技术基础 127
8.2 NoSQL的种类 131
8.2.1 键值存储 131
8.2.2 列存储 132
8.2.3 面向文档存储 132
8.2.4 图形存储 133
8.3 典型的NoSQL工具 134
8.3.1 Redis 135
8.3.2 Bigtable 135
8.3.3 CouchDB 137
8.3.4 Neo4j 138
本章小结 138
第9章 Spark概论 140
9.1 Spark概述 141
9.1.1 Spark简介 141
9.1.2 Spark发展 141
9.1.3 Scala语言 142
9.2 Spark与Hadoop 142
9.2.1 Hadoop的局限与不足 143
9.2.2 Spark的优点 143
9.2.3 Spark速度比Hadoop快的原因分解 144
9.3 Spark大数据处理架构及其生态系统 145
9.3.1 底层的Cluster Manager和Data Manager 145
9.3.2 中间层的Spark Runtime 146
9.3.3 高层的应用模块 148
9.4 Spark的应用 150
9.4.1 Spark的应用场景 150
9.4.2 应用Spark的成功案例 150
本章小结 151
第10章 云计算与大数据 153
10.1 云计算概论 154
10.1.1 云计算定义 154
10.1.2 云计算与大数据的关系 155
10.1.3 云计算基本特征 155
10.1.4 云计算服务模式 156
10.2 云计算核心技术 157
10.2.1 虚拟化技术 157
10.2.2 虚拟化软件及应用 158
10.2.3 资源池化技术 160
10.2.4 云计算部署模式 161
10.3 云计算仿真 162
10.4 云计算的安全 163
10.4.1 云计算安全现状 164
10.4.2 云计算安全服务体系 164
10.5 云计算应用案例 165
本章小结 172
第11章 大数据解决方案及相关案例 174
11.1 大数据解决方案基础 175
11.2 Intel大数据 176
11.2.1 Intel大数据解决方案 176
11.2.2 Intel大数据相关案例——中国移动广东公司详单、账单查询系统 178
11.3 百度大数据 180
11.3.1 百度大数据引擎 180
11.3.2 百度大数据+平台 181
11.3.3 相关应用 181
11.3.4 百度预测的使用方法 186
11.4 腾讯大数据 188
11.4.1 腾讯大数据解决方案 188
11.4.2 相关实例——广点通 190
本章小结 192
参考文献 193
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《全国高等中医药行业“十三五”创新教材 中医药学概论》翟华强 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《海绵城市概论》刘娜娜,张婧,王雪琴 2017
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《药学概论》于海平主编 2019
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019