概要 1
海量数据的机遇与挑战 1
结论 5
第一章 引言 11
挑战 11
当前进展 17
报告组成 19
参考文献 21
第二章 科学、技术、商业、国防、电信及其他领域的海量数据 22
海量数据出现在哪里 22
海量数据分析的挑战 24
大数据分析趋势 26
样例 30
参考文献 42
第三章 数据管理基础设施的规模扩大 44
扩大数据集的数量 44
通过分布式和并行系统实现计算技术的扩展 47
未来研究的趋势 61
参考文献 63
第四章 时态数据和实时算法 65
概述 65
数据采集 66
数据处理、表示和推理 68
针对时态数据集的系统和硬件 71
挑战 71
参考文献 72
第五章 大规模数据表示 74
概述 74
数据表示的目标 76
挑战和未来方向 82
参考文献 89
第六章 资源、权衡与局限性 93
概述 93
理论计算机科学的相关知识 94
差异与机会 98
参考文献 103
第七章 由海量数据建立模型 106
统计模型介绍 106
数据清洗 113
模型分类 115
模型调整与评估 121
挑战 127
参考文献 135
第八章 采样与海量数据 137
统计采样的常用技术 137
海量数据采样的挑战 145
参考文献 150
第九章 人类与数据的交互 153
概述 153
最新进展 154
人机协同的数据分析 159
机遇、挑战和方向 161
参考文献 164
第十章 海量数据分析的七个计算“巨人” 167
基本统计 170
广义N-体问题 171
图论计算 172
线性代数计算 174
优化 175
积分 176
对齐问题 177
讨论 178
参考文献 179
第十一章 结论 185
附录A 缩略语 191
附录B 委员会成员简介 193