第1章 概述 1
1.1 大数据基本概念 6
1.2 大数据基本特征 9
1.3 大数据基本技术 10
1.4 大数据基本处理 11
1.5 大数据基本分析 12
1.6 大数据应用简介 13
第2章 机遇与挑战及思考 17
2.1 大数据带来的新机遇和新挑战 17
2.2 大数据与机器学习 21
2.3 大数据处理模式与处理器体系结构 26
2.4 计算与存储融合体系结构及内存计算 33
2.5 大数据与数据管理及数据密集型计算 36
2.6 大数据与可视分析 38
2.7 大数据时代软件技术及大数据系统引擎技术面临的挑战 40
第3章 大数据存储与云计算及物联网 44
3.1 大数据存储渊源与大数据技术发展新目标 44
3.2 大数据与数据流及算法 48
3.3 大数据与云端存储 51
3.4 大数据分析的可伸缩云与数据密集型计算的应用 52
3.5 大数据与物联网:海-云计算模型 55
第4章 大数据与软件工程及软件技术 57
4.1 大数据与软件工程新思维 57
4.2 移动应用大数据与软件工程 58
4.3 大数据与软件工程教育 59
4.4 大数据与软件工程关键技术 60
4.5 基于大数据的软件设计模型 64
第5章 大数据时代的研究与应用 67
5.1 大数据与典型学科领域 67
5.2 大数据与生物多样性信息学及生物医学 71
5.3 大数据与用户理解及情感计算 73
5.4 大数据与文化及计算机专业教育 78
5.5 大数据与金融及实时竞价 79
5.6 大数据与复杂工业系统 81
5.7 大数据与电信业务 82
5.8 新生儿重症监护室中的大数据 87
5.9 淘宝自主研发的分布式数据库OceanBase简介 88
5.10 携程大数据平台简介 89
5.11 精硕科技——Hadoop在广告监测技术上的实践 91
5.12 武汉绿网——大数据在网络服务中的应用及网络演进 92
第6章 大数据与数据治理、挖掘、预测及分析 95
6.1 大数据:公司治理观点的价值、风险和成本 96
6.2 转换大数据为集体意识 98
6.3 大数据可能的意想不到的结果 99
6.4 使用大数据方法的业务过程分析 100
6.5 谷歌流感趋势预测的启示:大数据分析中的陷阱及小数据 101
6.6 大数据与预测分析 102
6.7 大数据与数据挖掘 103
6.8 大数据与数据分析及认知计算 106
6.9 淘宝真实数据的统计分析 109
第7章 大数据与数据科学及数据驱动 112
7.1 我们为什么需要数据科学 112
7.2 大数据研究的科学价值 113
7.3 数据科学家与领域专家 114
7.4 对于数据驱动创新公共政策的考虑 116
第8章 大数据与政府 118
8.1 政府与企业中大数据的应用比较 118
8.2 大数据和政府转型 119
8.3 城市计算与大数据 121
8.4 从数字脚印到城市计算 122
8.5 大数据下的灾难行为分析和城市应急管理 123
第9章 中国电力大数据 125
9.1 《中国电力大数据发展白皮书》简介 125
9.2 电网大数据研究及应用简介 126
9.3 国家电网公司信息通信新技术推动智能电网和“一强三优”现代公司创新发展行动计划简介 127
第10章 中国计算机学会大数据专家委员会关于大数据热点问题及发展趋势分析简介 129
10.1 2012年CCF给出的大数据热点问题 129
10.2 2013—2015年大数据十大趋势预测对比 130
10.3 2016年大数据发展趋势预测 132
第11章 虚拟机上Hadoop等的基本安装实践 135
11.1 Hadoop简介 135
11.2 安装VM ware-workstation 10.0及RedHat Linux 6.2 139
11.3 伪分布式模式下安装Hadoop 145
11.4 完全分布式模式下安装Hadoop 159
11.5 安装HBase 187
11.6 安装Hive及MySQL 191
11.7 Windows平台下安装Cygwin及Hadoop 203
11.8 Hadoop进程启动过程初步分析 211
11.9 安装及启动过程常见问题处理方法 214
11.10 主要文件配置内容示例 217
参考文献 222