《机器学习应用系统设计》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:有贺康顕,中山心太,西林孝著
  • 出 版 社:北京:中国电力出版社
  • 出版年份:2018
  • ISBN:9787519826208
  • 页数:244 页
图书介绍:本书共分9章,主要内容有:总结机器学习项目的推进流程,介绍机器学习的主要功能和各种算法,以垃圾邮件判别为例,介绍对学习完成后的预测模型进行离线评价的方法,梳理在计算机系统里集成机器学习功能的模式,同时介绍机器学习基础的日志设计,介绍机器学习分类任务里的正确答案数据的获取方法,介绍用于验证实施方案是否真正有效的统计鉴定、因果推理,以及AB试验等方法。第3章是预测模型的离线验证,本章则介绍实施过程中的实时验证。第7章以电影推荐为例,学习推荐预测系统的开发实现案例,阐述搜索式分析过程及分析报告,采用所谓UpliftModeling方法学习更有效的营销方法。

前言 1

第一部分 11

第1章 机器学习项目流程 11

1.1 如何利用机器学习 11

1.2 机器学习项目的流程 13

1.3 实际系统中的机器学习问题的处理方法 27

1.4 机器学习系统的成功要素 32

1.5 小结 34

第2章 机器学习的用途 35

2.1 算法选择 35

2.2 分类 37

2.3 回归 69

2.4 聚类与降维 72

2.5 其他 74

2.6 小结 76

第3章 学习结果的评价 77

3.1 分类的评价矩阵 77

3.2 回归的评价 86

3.3 机器学习系统的A/B测试 88

3.4 小结 89

第4章 机器学习系统的开发 91

4.1 机器学习系统的开发流程 91

4.2 系统设计 92

4.3 日志设计 105

4.4 小结 110

第5章 机器学习资源的收集 111

5.1 机器学习资源的获取 111

5.2 利用公开的数据集或模型 113

5.3 开发者自己创建训练数据 114

5.4 他人帮忙输入数据 116

5.5 数据创建众包 117

5.6 基于服务的用户输入 119

5.7 小结 120

第6章 效果验证 121

6.1 效果验证概述 121

6.2 假设检验的框架 125

6.3 假设检验的注意事项 131

6.4 因果效应的推断 137

6.5 A/B测试 141

6.6 小结 144

第二部分 147

第7章 电影推荐系统 147

7.1 概述 147

7.2 推荐系统功能 149

7.3 MovieLens的数据趋势 159

7.4 推荐系统的开发 165

7.5 小结 176

第8章 Kickstarter的数据分析 177

8.1 Kickstarter的API 177

8.2 Kickstarter的网络爬虫 178

8.3 数据变换 180

8.4 浏览Excel数据 181

8.5 数据透视表 185

8.6 达成目标却被取消的项目 190

8.7 国别的项目分析 192

8.8 形成分析报告 194

8.9 进一步的工作 204

8.10 小结 204

第9章 基于Uplift Modeling的营销资源效率分析 207

9.1 Uplift Modeling的四象限分区 208

9.2 扩展A/B测试的Uplift Modeling的概要 210

9.3 Uplift Modeling的数据集生成 211

9.4 利用两个预测模型的Uplift Modeling 214

9.5 Uplift Modeling的评价方法 218

9.6 实际应用 224

9.7 实际应用Uplift Modeling的相关事项 231

9.8 小结 233

参考文献 235

后记 239

致谢 241