前言 1
第一部分 11
第1章 机器学习项目流程 11
1.1 如何利用机器学习 11
1.2 机器学习项目的流程 13
1.3 实际系统中的机器学习问题的处理方法 27
1.4 机器学习系统的成功要素 32
1.5 小结 34
第2章 机器学习的用途 35
2.1 算法选择 35
2.2 分类 37
2.3 回归 69
2.4 聚类与降维 72
2.5 其他 74
2.6 小结 76
第3章 学习结果的评价 77
3.1 分类的评价矩阵 77
3.2 回归的评价 86
3.3 机器学习系统的A/B测试 88
3.4 小结 89
第4章 机器学习系统的开发 91
4.1 机器学习系统的开发流程 91
4.2 系统设计 92
4.3 日志设计 105
4.4 小结 110
第5章 机器学习资源的收集 111
5.1 机器学习资源的获取 111
5.2 利用公开的数据集或模型 113
5.3 开发者自己创建训练数据 114
5.4 他人帮忙输入数据 116
5.5 数据创建众包 117
5.6 基于服务的用户输入 119
5.7 小结 120
第6章 效果验证 121
6.1 效果验证概述 121
6.2 假设检验的框架 125
6.3 假设检验的注意事项 131
6.4 因果效应的推断 137
6.5 A/B测试 141
6.6 小结 144
第二部分 147
第7章 电影推荐系统 147
7.1 概述 147
7.2 推荐系统功能 149
7.3 MovieLens的数据趋势 159
7.4 推荐系统的开发 165
7.5 小结 176
第8章 Kickstarter的数据分析 177
8.1 Kickstarter的API 177
8.2 Kickstarter的网络爬虫 178
8.3 数据变换 180
8.4 浏览Excel数据 181
8.5 数据透视表 185
8.6 达成目标却被取消的项目 190
8.7 国别的项目分析 192
8.8 形成分析报告 194
8.9 进一步的工作 204
8.10 小结 204
第9章 基于Uplift Modeling的营销资源效率分析 207
9.1 Uplift Modeling的四象限分区 208
9.2 扩展A/B测试的Uplift Modeling的概要 210
9.3 Uplift Modeling的数据集生成 211
9.4 利用两个预测模型的Uplift Modeling 214
9.5 Uplift Modeling的评价方法 218
9.6 实际应用 224
9.7 实际应用Uplift Modeling的相关事项 231
9.8 小结 233
参考文献 235
后记 239
致谢 241