第1章 概述 1
1.1 大数据的基本概念 1
1.2 大数据的演变过程 2
1.3 大数据应用 4
1.4 大数据的处理模式 6
1.4.1 批处理 7
1.4.2 流处理 8
1.5 大数据管理的关键技术 9
1.5.1 大数据融合 9
1.5.2 大数据分析 10
1.5.3 大数据隐私 11
1.5.4 大数据能耗 12
1.5.5 大数据处理与硬件的协同 13
1.6 小结 15
第2章 大数据融合 16
2.1 引言 16
2.2 大数据融合的概念 17
2.2.1 大数据融合需求的独特性 18
2.2.2 大数据融合对象的独特性 20
2.3 大数据融合的方法论 23
2.3.1 数据库视角下的融合 23
2.3.2 认知计算和人工智能视角下的融合 25
2.3.3 两种融合方式的对比分析 28
2.3.4 大数据融合范式 30
2.4 数据融合技术 32
2.4.1 模式/本体对齐 32
2.4.2 实体链接 33
2.4.3 冲突解决 34
2.4.4 知识库自适应发展 35
2.5 知识融合技术 36
2.5.1 知识抽象与建模 36
2.5.2 关系推演 37
2.5.3 深度知识发现 38
2.5.4 普适机理的剖析和归纳 39
2.6 大数据融合的驱动枢纽 40
2.6.1 智能晶格 40
2.6.2 迁移学习 40
2.6.3 数据溯源 41
2.6.4 D&2V处理 42
2.7 小结 43
第3章 大数据存储 44
3.1 引言 44
3.2 大数据存储与管理方法 46
3.2.1 基于PCM的主存架构 47
3.2.2 基于闪存的主存扩展架构 47
3.2.3 基于多存储介质的分层存储架构 48
3.2.4 分布式存储与缓存架构 49
3.3 基于新型存储的大数据管理 50
3.3.1 存储管理 50
3.3.2 索引管理 51
3.3.3 查询处理 52
3.3.4 事务处理 53
3.3.5 大数据分析 53
3.4 大数据处理与存储一体化技术 54
3.4.1 一体化架构中的大数据存储 55
3.4.2 一体化架构中的大数据处理 56
3.4.3 一体化架构面临的挑战 57
3.5 小结 58
第4章 大数据分析 60
4.1 引言 60
4.1.1 传统的数据分析技术 60
4.1.2 大数据的分析技术 62
4.2 大数据的实时分析 64
4.2.1 实时分析的背景和概念 64
4.2.2 实时分析技术 66
4.3 大数据的交互式分析 70
4.3.1 交互式分析的背景和概念 70
4.3.2 交互式分析技术 71
4.4 云在线聚集 74
4.4.1 云在线聚集技术的背景和概念 74
4.4.2 云在线聚集的关键技术 77
4.5 大数据的智能分析 81
4.5.1 大数据分析中的计算智能 81
4.5.2 智能分析的主要技术 82
4.6 小结 84
第5章 大数据隐私 85
5.1 引言 85
5.1.1 大数据的类型 86
5.1.2 隐私特征与类别 87
5.1.3 大数据的隐私风险 88
5.2 隐私保护技术 91
5.2.1 匿名化技术 91
5.2.2 数据加密技术 92
5.2.3 差分隐私技术 93
5.2.4 隐私信息检索技术 94
5.3 隐私保护技术的应用 94
5.3.1 位置大数据中的隐私保护 95
5.3.2 数据发布和分析中的隐私保护 97
5.3.3 互联网搜索中的隐私保护 101
5.3.4 云计算中的隐私保护 103
5.4 大数据隐私管理 107
5.4.1 隐私管理的目标 107
5.4.2 主动式隐私管理框架 108
5.5 小结 110
第6章 大数据管理系统 111
6.1 引言 111
6.2 云计算:大数据的基础平台与支撑技术 112
6.3 批数据与流数据管理系统 116
6.3.1 批数据管理系统 118
6.3.2 流数据管理系统 119
6.3.3 混合处理系统 120
6.4 SQL、NoSQL与NewSQL系统 121
6.4.1 SQL类数据库 123
6.4.2 NoSQL类数据库 125
6.4.3 NewSQL类数据库 128
6.5 小结 129
第7章 基于大数据的交叉学科研究 131
7.1 引言 131
7.2 在线用户行为演化研究 133
7.2.1 在线用户行为大数据 133
7.2.2 在线用户行为演化 134
7.3 在线用户兴趣长程演化 135
7.3.1 理论与方法 136
7.3.2 在线用户兴趣演化分析 137
7.4 在线用户集体注意力流 141
7.4.1 注意力流网络 142
7.4.2 注意力流网络中的异速标度律 143
7.4.3 注意力流的应用:Web站点排名 144
7.5 在线用户集体注意力流的普适模式 146
7.5.1 异速标度律 147
7.5.2 耗散律 149
7.5.3 引力律 150
7.5.4 Heaps律 151
7.6 小结 152
附录 大数据思考 154
附录A 大数据与小数据 154
附录B 数据的起源 158
附录C 大数据时代的信息系统 161
附录D 数据库(DB)与大数据(BD) 163
附录E 大数据多学科交叉研究 166
附录F 创新数据管理研究2.0 168
附录G 面向移动计算与云计算的数据管理 170
附录H 大数据时代的到来:数据空间与闪存数据库研究 172
附录I 隐私保护研究 175
附录J 网络与移动数据管理研究 176
附录K 大数据管理基石:Web数据管理 178
附录L 大数据管理基石:数据集成 181
附录M 从数据库大师看数据库发展 182
参考文献 185