当前位置:首页 > 工业技术
数据之美
数据之美

数据之美PDF电子书下载

工业技术

  • 电子书积分:13 积分如何计算积分?
  • 作 者:(美)托比(SegaranT.)等编著;祝洪凯,李妹芳,段炼译
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2010
  • ISBN:9787111315124
  • 页数:354 页
图书介绍:本书原书是《代码之美》的系列篇,采用和《代码之美》相似的写作风格和模式,是Oreilly的Beautiful系列中的重要新产品。本书通过世界上最好的数据工作者的示例,向读者展示处理数据的方法。本书使得读者可以站在优秀的数据设计师、管理者和处理者的肩上,去仔细审视涉及到数据的一些最有趣的项目。本书中的故事涵盖了数据获取、存储、检索、管理、操作和可视化的方方面面。读者既可以从中获取教训,也可以获得最佳的实践经验。
《数据之美》目录
标签:编著 数据

前言 1

第1章 在数据中观察生活 Nathan Yau 5

个人环境影响报告(PEIR) 6

your.flowingdata(YFD) 7

个人数据收集 7

数据存储 9

数据处理 10

数据可视化 11

要点 19

如何参与 19

第2章 美丽的人们:设计数据收集方法时牢记用户 Jonathan Follett和Matthew Holm 21

简介:用户共鸣正当其时 21

项目:关于一个新奢侈品的用户调查 23

数据收集面临的特殊挑战 23

设计解决方案 25

结论和反思 35

第3章 火星上的嵌入式图像数据处理 J.M.Hughes 39

摘要 39

简介 39

一些背景 41

数据是否打包 44

三个任务 45

对图像切槽 47

传递图像:三个任务间的通信 50

获取图片:图像下载和处理 51

图像压缩 54

“下行”或一切都从这里向下传输 55

结束语 56

第4章 PNUTShell中的云存储设计 Brian F Cooper、Raghu Ramakrishnan和Utkarsh Srivastava 59

简介 59

更新数据 61

复杂查询 68

和其他系统的比较 72

结论 75

致谢 75

参考文献 75

第5章 信息平台和数据科学家的兴起 Jeff Hammerbacher 77

图书馆和大脑 77

Facebook具有了“自知之明” 78

商业智能系统 79

数据仓库的消亡和重起 80

超越数据仓库 81

“猎豹”和“大象” 82

不合理的数据有效性 84

新工具和应用研究 85

MAD技术和Cosmos 86

作为数据空间的信息平台 86

数据科学家 87

结论 88

第6章 照片档案的地理之美 Jason Dykes和Jo Wood 89

数据之美:Geograph项目 90

可视化、美丽和树形图 93

Geograph在使用条款上的观点 95

发现之美 102

反思和结论 105

致谢 105

参考文献 106

第7章 数据发现数据 Jeff Jonas和Lisa Sokol 109

简介 109

实时发现的好处 110

赌桌上的舞弊 111

企业的可发现性 114

目录:无价之宝 116

相关性:什么是重要的以及对谁重要 118

各个组件及特殊考虑 119

隐私考虑 121

结束语 122

第8章 实时的可移动数据 Jud Valeski 123

简介 123

前沿技术 124

社交数据规范化 132

结束语:通过Gnip思考 135

第9章 探寻Deep Web Alon Halevy和Jayant Madhaven 137

什么是Deep Web 137

提供Deep Web访问的其他可选方案 139

结论 150

参考文献 150

第10章 构建Radiohead的“House of Cards” Aaron Kablin和Valdean Klump 153

这一切是如何开始的 153

数据捕捉设备 155

两种数据捕捉系统的优点 158

数据 159

捕捉数据,即“拍摄” 159

处理数据 164

后期数据处理 164

发布视频 165

结束语 168

第11章 都市数据可视化 Michal Migurski 171

引言 171

背景 172

解决棘手问题 173

公开数据 178

重新回顾 182

结束语 184

第12章 Sense.us的设计 Jeffrey Heer 187

可视化和社会数据分析 188

数据 190

可视化 192

协作 198

“向导”和“偷窥” 202

结论 206

参考文献 207

第13章 数据所做不到的 Coco Krumme 209

何时数据无法驱动 212

结束语 221

参考文献 221

第14章 自然语言语料库数据 Peter Norvig 223

分词 224

密码 232

拼写纠正 238

其他任务 244

讨论和结论 245

致谢 246

第15章 数据中的生命:DNA漫谈 Matt Wood和Ben Blackburne 247

用DNA存储数据 247

DNA作为数据源 254

搏击数据洪流 257

DNA的未来 261

致谢 261

第16章 美化真实世界中的数据 Jean-Claude Bradley、Rajarshi Guha、Andrew Lang、Pierre Lindenbaum、Cameron Neylon、Antony Williams和Egon Willighagen 263

关于真实数据的问题 263

提供可以追溯到记录本的原始数据 264

验证开放来源数据 266

在线发布数据 267

结束循环:采用可视化技术启发新实验 274

在开放数据和免费服务下建立数据网络 277

致谢 280

参考文献 280

第17章 数据浅析:探索形形色色的社会定型 Brendan O’Connor和Lukas Biewald 281

引言 281

预处理数据 282

探索数据 284

年龄、魅力和性别 287

观察标签 292

哪些单词具有性别化 296

聚类 298

结论 302

致谢 302

参考文献 302

第18章 旧金山海湾区之殇:次贷危机的影响 Hadley Wickham、Deborah F.Swayne和David Poole 305

引言 305

我们是如何获取数据的 305

地理编码 307

数据检查 307

分析 308

通货膨胀的影响 308

富者更富,穷者更穷 310

地理区别 312

人口普查信息 314

探索旧金山 317

结论 322

参考文献 323

第19章 美丽的政治数据 Andrew Gelman、Jonathan p.Kastellec和Yair Ghitza 325

实例1:重新划分选区和党派偏好 326

实例2:估计的时间序列 327

实例3:年龄和选举 329

实例4:关于最高法院被提名人的公众舆论和参议院选票 330

实例5:宾夕法尼亚州的本地党派 332

结论 333

参考文献 334

第20章 连接数据 Toby Segaran 335

实际上到底存在哪些公共数据 336

连接数据的可能性 337

企业内部 338

连接数据的障碍 339

可能的解决方案 343

集体调解 344

结论 348

附录 作者简介 349

相关图书
作者其它书籍
返回顶部