第1章 机器学习引言 1
1.1什么是机器学习 1
1.2分类方法概述 2
1.3聚类方法概述 2
1.4监督学习概述 3
1.5无监督学习概述 4
1.6增强学习概述 4
1.7结构化预测概述 5
1.8神经网络概述 5
1.9深度学习概述 6
第2章 分类 7
2.1引言 7
2.2判别函数分析:地下卤水地质化学测量 8
2.3多元逻辑回归:理解学生的课程计划选择 15
2.4 Tobit回归:评估学生的学术能力 20
2.5泊松回归:理解加拉帕戈斯群岛现存物种 27
第3章 聚类 38
3.1引言 38
3.2层次聚类:世界银行样本数据集 39
3.3层次聚类:1999~2010年亚马逊雨林的烧毁情况 44
3.4层次聚类:基因聚类 55
3.5二进制聚类:数学测验 68
3.6 k均值聚类:欧洲各国蛋白质消耗量 75
3.7 k均值聚类:食品 80
第4章 模型选择和正则化 86
4.1引言 86
4.2压缩方法:每天消耗的卡路里 87
4.3降维方法:Delta航空公司航空队 100
4.4主成分分析:理解世界菜肴 109
第5章 非线性 114
5.1广义加性模型:衡量新西兰的家庭收入 114
5.2平滑样条:理解汽车和速度 119
5.3局部回归:理解干旱警告和影响 129
第6章 监督学习 136
6.1引言 136
6.2决策树学习:对胸痛患者的预先医疗护理指示 137
6.3决策树学习:基于收入的房地产价值分布 145
6.4决策树学习:预测股票走势方向 154
6.5朴素贝叶斯:预测股票走势方向 170
6.6随机森林:货币交易策略 184
6.7支持向量机:货币交易策略 193
6.8随机梯度下降:成人收入 201
第7章 无监督学习 208
7.1引言 208
7.2自组织映射:可视化热图 209
7.3矢量量化:图像聚类 212
第8章 增强学习 217
8.1引言 217
8.2马尔可夫链:股票区制转移模型 218
8.3马尔可夫链:多渠道归因模型 229
8.4马尔可夫链:汽车租赁代理服务 239
8.5连续马尔可夫链:加油站的车辆服务 243
8.6蒙特卡罗模拟:校准Hull-White短期利率 247
第9章 结构化预测 257
9.1引言 257
9.2隐马尔可夫模型:欧元和美元 257
9.3隐马尔可夫模型:区制检测 263
第10章 神经网络 270
10.1引言 270
10.2为S&P 500建模 270
10.3衡量失业率 278
第11章 深度学习 292
11.1引言 292
11.2循环神经网络:预测周期信号 292
第12章 案例研究:探索世界银行数据 299
12.1引言 299
12.2探索世界银行数据 299
第13章 案例研究:再保险合同定价 316
13.1引言 316
13.2再保险合同定价 316
第14章 案例研究:用电量预测 329
14.1引言 329
14.2用电量测量 329