大数据导论PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:周苏,王文编著
- 出 版 社:北京:清华大学出版社
- 出版年份:2016
- ISBN:9787302440734
- 页数:266 页
第1章 大数据与大数据时代 1
1.1 什么是大数据 2
1.1.1 天文学——信息爆炸的起源 3
1.1.2 大数据的定义 6
1.1.3 用3V描述大数据特征 7
1.1.4 广义的大数据 9
1.2 大数据变革思维 9
1.3 大数据的结构类型 10
1.4 大数据的发展 11
1.4.1 硬件性价比提高与软件技术进步 11
1.4.2 云计算的普及 12
1.4.3 大数据作为BI的进化形式 12
1.4.4 从交易数据分析到交互数据分析 13
第2章 大数据的可视化 19
2.1 数据与可视化 21
2.1.1 数据的可变性 22
2.1.2 数据的不确定性 23
2.1.3 数据所依存的背景信息 24
2.1.4 打造最好的可视化效果 25
2.2 数据与图形 25
2.2.1 数据与走势 26
2.2.2 视觉信息的科学解释 28
2.2.3 图片和分享的力量 29
2.3 公共数据集 30
2.4 实时可视化 31
2.5 挑战图像的多变性 32
2.6 数据可视化的运用 33
2.6.1 可视化对认知的帮助 34
2.6.2 7个数据类型 35
2.6.3 7个基本任务 36
2.6.4 数据可视化的挑战 38
第3章 大数据的商业规则 45
3.1 大数据的跨界年度 46
3.2 谷歌的大数据行动 47
3.3 亚马逊的大数据行动 49
3.4 将信息变成一种竞争优势 50
3.4.1 数据价格下降,数据需求上升 51
3.4.2 大数据应用程序的兴起 52
3.4.3 实时响应,大数据用户的新要求 53
3.4.4 企业构建大数据战略 53
3.5 大数据营销 54
3.5.1 像媒体公司一样思考 54
3.5.2 营销面对新的机遇与挑战 55
3.5.3 自动化营销 56
3.5.4 为营销创建高容量和高价值的内容 57
3.5.5 内容营销 57
3.5.6 内容创作与众包 58
3.5.7 用投资回报率评价营销效果 59
第4章 大数据时代的思维变革 65
4.1 大数据时代的大挑战 67
4.2 转变之一:样本=总体 68
4.2.1 小数据时代的随机采样 68
4.2.2 大数据与乔布斯的癌症治疗 71
4.2.3 全数据模式:样本=总体 72
4.3 转变之二:接受数据的混杂性 74
4.3.1 允许不精确 74
4.3.2 大数据的简单算法与小数据的复杂算法 76
4.3.3 纷繁的数据越多越好 77
4.3.4 混杂性是标准途径 78
4.3.5 新的数据库设计 79
4.3.6 5%的数字数据与95%的非结构化数据 81
4.4 转变之三:数据的相关关系 81
4.4.1 关联物,预测的关键 81
4.4.2 “是什么”,而不是“为什么” 84
4.4.3 通过因果关系了解世界 84
4.4.4 通过相关关系了解世界 86
第5章 大数据促进医疗与健康 93
5.1 大数据与循证医学 95
5.2 大数据带来的医疗新突破 96
5.2.1 量化自我,关注个人健康 97
5.2.2 可穿戴的个人健康设备 98
5.2.3 大数据时代的医疗信息 99
5.2.4 CellMiner——对抗癌症的新工具 100
5.3 医疗信息数字化 102
5.4 搜索:超级大数据的最佳伙伴 104
5.5 数据决策的成功崛起 105
5.5.1 数据辅助诊断 106
5.5.2 你考虑过……了吗 106
5.5.3 大数据分析使数据决策崛起 107
第6章 大数据激发创造力 112
6.1 大数据帮助改善设计 114
6.1.1 少而精是设计的核心 115
6.1.2 与玩家共同设计游戏 116
6.1.3 以人为本的汽车设计理念 116
6.1.4 寻找最佳音响效果 118
6.1.5 建筑,数据取代直觉 119
6.2 大数据操作回路 119
6.2.1 信号与噪声 120
6.2.2 大数据反馈回路 120
6.2.3 最小数据规模 121
6.2.4 大数据应用程序的优势与作用 121
6.3 大数据资产的崛起 122
6.3.1 大数据催生崭新的应用程序 122
6.3.2 寻找大数据“空白”,提取最大价值 122
第7章 大数据预测分析 126
7.1 什么是预测分析 130
7.1.1 预测分析的作用 130
7.1.2 行业应用举例 131
7.2 数据情感和情感数据 132
7.2.1 从博客观察集体情感 132
7.2.2 预测分析博客中的情绪 133
7.2.3 影响情绪的重要因素——金钱 135
7.3 数据具有内在预测性 136
7.4 情感的因果关系 137
7.4.1 焦虑指数与标普500指数 137
7.4.2 验证情感和被验证的情感 138
7.4.3 情绪指标影响金融市场 139
第8章 大数据促进学习 149
8.1 打造网络教育体系 152
8.1.1 典型的网络教育形式 152
8.1.2 未来的教育:线上线下结合 153
8.1.3 跟踪教学效果 154
8.1.4 形成学习能力 155
8.2 机器学习及其研究 155
8.2.1 什么是人工智能 156
8.2.2 什么是机器学习 157
8.2.3 基本结构 159
8.2.4 研究领域 160
8.3 机器学习的分类 160
8.3.1 基于学习策略的分类 160
8.3.2 基于所获取知识的表示形式分类 161
8.3.3 按应用领域分类 162
8.3.4 按学习形式分类 162
第9章 大数据在云端 171
9.1 云端大数据 173
9.1.1 什么是云计算 173
9.1.2 云计算的服务形式 174
9.1.3 云计算与大数据 175
9.1.4 云基础设施 176
9.2 计算虚拟化 176
9.3 大数据存储 177
9.3.1 传统存储系统时代 178
9.3.2 大数据时代的新挑战 178
9.3.3 分布式存储 180
9.3.4 云存储 180
9.3.5 大数据存储的其他需求 181
9.4 网络虚拟化 182
9.4.1 网卡虚拟化 182
9.4.2 虚拟交换机 183
9.4.3 接入层的虚拟化 184
9.4.4 覆盖网络虚拟化 184
9.4.5 软件定义的网络 184
9.4.6 对大数据处理的意义 185
9.5 数据即服务 185
9.5.1 数据应用 185
9.5.2 数据清理 185
9.5.3 数据保密 186
9.6 云的挑战 186
第10章 支撑大数据的技术 193
10.1 开源技术的商业支援 195
10.2 大数据的技术架构 196
10.3 什么是Hadoop 197
10.3.1 什么是分布式系统 197
10.3.2 Hadoop的由来 199
10.3.3 Hadoop的优势 200
10.3.4 Hadoop的发行版本 200
10.4 大数据的数据处理基础 202
10.4.1 Hadoop与NoSQL 203
10.4.2 NoSQL与RDBMS的主要区别 204
10.4.3 NewSQL 206
10.5 相关的大数据技术 207
10.5.1 神经网络 207
10.5.2 自然语言处理 208
10.5.3 语义检索 209
10.5.4 链接挖掘 210
10.5.5 A/B测试 210
第11章 数据科学与数据科学家 217
11.1 什么是数据科学 218
11.2 数据分析生命周期模型 219
11.3 数据科学家 221
11.3.1 大数据生态系统中的关键角色 222
11.3.2 数据科学家所需的技能 223
11.3.3 数据科学家所需的素质 226
11.3.4 数据科学家的学习内容 227
11.4 数据科学的重要技能 229
11.4.1 数据科学技能和熟练程度 230
11.4.2 重要数据科学技能 230
11.4.3 因职业角色而异的十大技能 231
11.4.4 职业角色的重要技能 233
第12章 大数据的未来 240
12.1 消费者的隐私权 242
12.2 连接开放数据 244
12.2.1 LOD运动 244
12.2.2 对政府公开的影响 245
12.2.3 利用开放数据的创业型公司 247
12.3 数据市场的兴起 247
12.3.1 Factual 248
12.3.2 Windows Azure Marketplace 248
12.3.3 Infochimps 248
12.3.4 Public Data Sets On AWS 249
12.3.5 不同的商业模式 249
12.4 将原创数据变为增值数据 250
12.5 大数据未来展望 251
12.5.1 大数据存储和管理 252
12.5.2 传统IT系统到大数据系统的过渡 252
12.5.3 大数据分析 253
12.5.4 大数据安全 254
12.5.5 数据科学 254
参考文献 266
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《物联网导论》张翼英主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《材料导论》张会主编 2019
- 《化工传递过程导论 第2版》阎建民,刘辉 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019