《海量数据分析前沿》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:美国国家学术院国家研究委员会组编;华东师范大学数据科学与工程研究院译
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2015
  • ISBN:9787302395478
  • 页数:198 页
图书介绍:“海量数据分析前沿”调查了海量数据分析中的前沿问题,指出大数据对自然科学,互联网行业,商业决策和国家安全的重要作用。报告认为针对小数据的算法和知识推断工具不一定适用于大规模数据,需要研究新的方法来应对大数据挑战。本书指出了未来可能的研究方向,描述了7个主要的海量数据分析问题,并提出从计算机科学,统计,机器学习等跨学科知识来进行大数据分析。

概要 1

海量数据的机遇与挑战 1

结论 5

第一章 引言 11

挑战 11

当前进展 17

报告组成 19

参考文献 21

第二章 科学、技术、商业、国防、电信及其他领域的海量数据 22

海量数据出现在哪里 22

海量数据分析的挑战 24

大数据分析趋势 26

样例 30

参考文献 42

第三章 数据管理基础设施的规模扩大 44

扩大数据集的数量 44

通过分布式和并行系统实现计算技术的扩展 47

未来研究的趋势 61

参考文献 63

第四章 时态数据和实时算法 65

概述 65

数据采集 66

数据处理、表示和推理 68

针对时态数据集的系统和硬件 71

挑战 71

参考文献 72

第五章 大规模数据表示 74

概述 74

数据表示的目标 76

挑战和未来方向 82

参考文献 89

第六章 资源、权衡与局限性 93

概述 93

理论计算机科学的相关知识 94

差异与机会 98

参考文献 103

第七章 由海量数据建立模型 106

统计模型介绍 106

数据清洗 113

模型分类 115

模型调整与评估 121

挑战 127

参考文献 135

第八章 采样与海量数据 137

统计采样的常用技术 137

海量数据采样的挑战 145

参考文献 150

第九章 人类与数据的交互 153

概述 153

最新进展 154

人机协同的数据分析 159

机遇、挑战和方向 161

参考文献 164

第十章 海量数据分析的七个计算“巨人” 167

基本统计 170

广义N-体问题 171

图论计算 172

线性代数计算 174

优化 175

积分 176

对齐问题 177

讨论 178

参考文献 179

第十一章 结论 185

附录A 缩略语 191

附录B 委员会成员简介 193