前言 1
第1章 在数据中观察生活 Nathan Yau 5
个人环境影响报告(PEIR) 6
your.flowingdata(YFD) 7
个人数据收集 7
数据存储 9
数据处理 10
数据可视化 11
要点 19
如何参与 19
第2章 美丽的人们:设计数据收集方法时牢记用户 Jonathan Follett和Matthew Holm 21
简介:用户共鸣正当其时 21
项目:关于一个新奢侈品的用户调查 23
数据收集面临的特殊挑战 23
设计解决方案 25
结论和反思 35
第3章 火星上的嵌入式图像数据处理 J.M.Hughes 39
摘要 39
简介 39
一些背景 41
数据是否打包 44
三个任务 45
对图像切槽 47
传递图像:三个任务间的通信 50
获取图片:图像下载和处理 51
图像压缩 54
“下行”或一切都从这里向下传输 55
结束语 56
第4章 PNUTShell中的云存储设计 Brian F Cooper、Raghu Ramakrishnan和Utkarsh Srivastava 59
简介 59
更新数据 61
复杂查询 68
和其他系统的比较 72
结论 75
致谢 75
参考文献 75
第5章 信息平台和数据科学家的兴起 Jeff Hammerbacher 77
图书馆和大脑 77
Facebook具有了“自知之明” 78
商业智能系统 79
数据仓库的消亡和重起 80
超越数据仓库 81
“猎豹”和“大象” 82
不合理的数据有效性 84
新工具和应用研究 85
MAD技术和Cosmos 86
作为数据空间的信息平台 86
数据科学家 87
结论 88
第6章 照片档案的地理之美 Jason Dykes和Jo Wood 89
数据之美:Geograph项目 90
可视化、美丽和树形图 93
Geograph在使用条款上的观点 95
发现之美 102
反思和结论 105
致谢 105
参考文献 106
第7章 数据发现数据 Jeff Jonas和Lisa Sokol 109
简介 109
实时发现的好处 110
赌桌上的舞弊 111
企业的可发现性 114
目录:无价之宝 116
相关性:什么是重要的以及对谁重要 118
各个组件及特殊考虑 119
隐私考虑 121
结束语 122
第8章 实时的可移动数据 Jud Valeski 123
简介 123
前沿技术 124
社交数据规范化 132
结束语:通过Gnip思考 135
第9章 探寻Deep Web Alon Halevy和Jayant Madhaven 137
什么是Deep Web 137
提供Deep Web访问的其他可选方案 139
结论 150
参考文献 150
第10章 构建Radiohead的“House of Cards” Aaron Kablin和Valdean Klump 153
这一切是如何开始的 153
数据捕捉设备 155
两种数据捕捉系统的优点 158
数据 159
捕捉数据,即“拍摄” 159
处理数据 164
后期数据处理 164
发布视频 165
结束语 168
第11章 都市数据可视化 Michal Migurski 171
引言 171
背景 172
解决棘手问题 173
公开数据 178
重新回顾 182
结束语 184
第12章 Sense.us的设计 Jeffrey Heer 187
可视化和社会数据分析 188
数据 190
可视化 192
协作 198
“向导”和“偷窥” 202
结论 206
参考文献 207
第13章 数据所做不到的 Coco Krumme 209
何时数据无法驱动 212
结束语 221
参考文献 221
第14章 自然语言语料库数据 Peter Norvig 223
分词 224
密码 232
拼写纠正 238
其他任务 244
讨论和结论 245
致谢 246
第15章 数据中的生命:DNA漫谈 Matt Wood和Ben Blackburne 247
用DNA存储数据 247
DNA作为数据源 254
搏击数据洪流 257
DNA的未来 261
致谢 261
第16章 美化真实世界中的数据 Jean-Claude Bradley、Rajarshi Guha、Andrew Lang、Pierre Lindenbaum、Cameron Neylon、Antony Williams和Egon Willighagen 263
关于真实数据的问题 263
提供可以追溯到记录本的原始数据 264
验证开放来源数据 266
在线发布数据 267
结束循环:采用可视化技术启发新实验 274
在开放数据和免费服务下建立数据网络 277
致谢 280
参考文献 280
第17章 数据浅析:探索形形色色的社会定型 Brendan O’Connor和Lukas Biewald 281
引言 281
预处理数据 282
探索数据 284
年龄、魅力和性别 287
观察标签 292
哪些单词具有性别化 296
聚类 298
结论 302
致谢 302
参考文献 302
第18章 旧金山海湾区之殇:次贷危机的影响 Hadley Wickham、Deborah F.Swayne和David Poole 305
引言 305
我们是如何获取数据的 305
地理编码 307
数据检查 307
分析 308
通货膨胀的影响 308
富者更富,穷者更穷 310
地理区别 312
人口普查信息 314
探索旧金山 317
结论 322
参考文献 323
第19章 美丽的政治数据 Andrew Gelman、Jonathan p.Kastellec和Yair Ghitza 325
实例1:重新划分选区和党派偏好 326
实例2:估计的时间序列 327
实例3:年龄和选举 329
实例4:关于最高法院被提名人的公众舆论和参议院选票 330
实例5:宾夕法尼亚州的本地党派 332
结论 333
参考文献 334
第20章 连接数据 Toby Segaran 335
实际上到底存在哪些公共数据 336
连接数据的可能性 337
企业内部 338
连接数据的障碍 339
可能的解决方案 343
集体调解 344
结论 348
附录 作者简介 349