第一部分 准备和收集数据与知识 2
第1章 数据科学的逻辑 2
1.1数据科学与本书 4
1.2意识的可贵 7
1.3研发人员与数据科学家 9
1.4需要成为软件研发者吗 12
1.5需要明白统计学吗 13
1.6优先级:知识、技术、观点 14
1.7最佳实践 17
1.8阅读本书:我怎么讨论概念 23
小结 24
第2章 通过好的提问设置目标 26
2.1聆听客户 27
2.2提出关于数据的好问题 37
2.3用数据回答问题 42
2.4设定目标 48
2.5计划要有弹性 50
练习 51
小结 51
第3章 周围的数据:虚拟的荒野 52
3.1数据作为研究对象 52
3.2数据可能存在的地方,以及如何与之交互 62
3.3数据侦察 80
3.4案例:microRNA与基因表达 89
练习 94
小结 95
第4章 数据整理:从捕捉到驯化 96
4.1案例研究:最佳田径表演 97
4.2准备整理数据 101
4.3技巧与工具 109
4.4常见的陷阱 112
练习 119
小结 119
第5章 数据评估:动手检查 120
5.1案例:安然的电子邮件数据 121
5.2描述性统计 123
5.3检查数据的假设 130
5.4寻找特定的实体 134
5.5大概的统计分析 140
练习 147
小结 147
第二部分 构建软件和统计产品 150
第6章 制订计划 150
6.1学到了什么 152
6.2重新考虑期望和目标 158
6.3规划 164
6.4沟通新目标 175
练习 176
小结 177
第7章 统计建模:概念与基础 178
7.1如何看待统计 179
7.2统计学:与数据科学相关的领域 180
7.3数学 184
7.4统计模型与推理 194
7.5其他的统计方法 218
练习 227
小结 227
第8章 软件:统计学在行动 229
8.1电子表格和用户图形界面应用 230
8.2编程 239
8.3选择统计软件工具 264
8.4把统计转换成软件 271
练习 277
小结 278
第9章 辅助软件:更大、更快、更高效 279
9.1数据库 280
9.2高性能计算 287
9.3云服务 290
9.4大数据技术 293
9.5 ××即服务 297
练习 298
小结 298
第10章 执行计划:汇总 299
10.1执行计划的诀窍 300
10.2修改计划 308
10.3结果:知道什么时候足够好 310
10.4案例研究:基因活性测定协议 315
练习 328
小结 329
第三部分 整理产品结束项目 332
第11章 交付产品 332
11.1了解客户 333
11.2交付形式 335
11.3内容 345
11.4案例:分析电子游戏 351
练习 353
小结 353
第12章 交付后:问题与修改 354
12.1产品及其使用问题 354
12.2反馈 364
12.3产品修改 370
练习 377
小结 378
第13章 结束:项目善后 379
13.1项目善后 380
13.2从项目中学习 392
13.3展望未来 396
练习 398
小结 399
练习:案例与答案 400