第1章 走进大数据时代 1
1.1 大数据发展现状 1
1.1.1 大数据国外发展现状 1
1.1.2 我国促进大数据发展的公共政策 2
1.1.3 广东省的大数据发展政策 4
1.2 认识大数据 5
1.2.1 大数据的概念 5
1.2.2 大数据的特征 5
1.3 大数据技术架构 7
1.3.1 基础设施支持 7
1.3.2 数据采集 7
1.3.3 数据存储 8
1.3.4 数据计算 9
1.3.5 数据可视化 9
1.4 大数据应用领域 10
1.4.1 政务大数据 10
1.4.2 金融大数据 10
1.4.3 城市交通大数据 12
1.4.4 医疗大数据 14
1.4.5 企业管理大数据 15
1.5 大数据的机遇与挑战 17
第2章 大数据关键技术 18
2.1 大数据存储 18
2.1.1 SQL与传统数据库 19
2.1.2 NoSQL数据库 19
2.1.3 NewSQL数据库 23
2.1.4 分布式存储与云存储 24
2.2 大数据处理与计算 28
2.2.1 大数据计算框架——MapReduce 28
2.2.2 Hadoop平台及相关生态系统 30
2.2.3 Spark计算框架及相关生态系统 37
2.3 流式大数据 40
2.3.1 流式大数据概述 40
2.3.2 流式大数据处理框架 41
2.3.3 流式大数据的应用 48
第3章 大数据挖掘与分析 49
3.1 大数据挖掘与分析前沿 49
3.1.1 数据挖掘与分析的环境演变 49
3.1.2 数据挖掘流程概述 50
3.1.3 文本与多媒体挖掘 52
3.1.4 Web挖掘 52
3.2 大数据挖掘与分析的理论及方法 53
3.2.1 关联规则 54
3.2.2 回归与分类 56
3.2.3 聚类分析 63
3.2.4 深度学习 64
3.3 大数据挖掘与分析相关工具 66
3.3.1 Mahout 66
3.3.2 MLlib 68
3.3.3 TensorFlow 69
第4章 大数据的应用 72
4.1 大数据应用的战略意义与优势 72
4.1.1 促进大数据应用的战略意义 72
4.1.2 我国发展大数据应用的优势 75
4.2 大数据产业的发展方向 76
4.3 大数据应用案例 78
4.3.1 国外大数据应用经典案例 78
4.3.2 国内大数据应用典型案例 80
4.3.3 广东省大数据应用案例 81
4.4 大数据应用的成效、问题与趋势展望 84
4.4.1 大数据应用取得的成效 84
4.4.2 当前大数据应用存在的主要问题 85
4.4.3 大数据应用的趋势展望 86
参考文献 89