第1章 导论 1
1.1 统计学习概述 1
1.2 统计学习简史 4
1.3 关于这本书 4
1.4 这本书适用的读者群 6
1.5 记号与简单的矩阵代数 6
1.6 本书的内容安排 8
1.7 用于实验和习题的数据集 9
1.8 本书网站 10
1.9 致谢 10
第2章 统计学习 11
2.1 什么是统计学习 11
2.2 评价模型精度 21
2.3 实验:R语言简介 30
2.4 习题 37
第3章 线性回归 41
3.1 简单线性回归 42
3.2 多元线性回归 49
3.3 回归模型中的其他注意事项 57
3.4 营销计划 70
3.5 线性回归与K最近邻法的比较 72
3.6 实验:线性回归 75
3.7 习题 84
第4章 分类 89
4.1 分类问题概述 89
4.2 为什么线性回归不可用 90
4.3 逻辑斯谛回归 91
4.4 线性判别分析 96
4.5 分类方法的比较 105
4.6 R实验:逻辑斯谛回归、LDA、QDA和KNN 107
4.7 习题 117
第5章 重抽样方法 121
5.1 交叉验证法 121
5.2 自助法 129
5.3 实验:交叉验证法和自助法 131
5.4 习题 136
第6章 线性模型选择与正则化 140
6.1 子集选择 141
6.2 压缩估计方法 148
6.3 降维方法 157
6.4 高维问题 163
6.5 实验1:子集选择方法 167
6.6 实验2:岭回归和lasso 173
6.7 实验3:PCR和PLS回归 177
6.8 习题 180
第7章 非线性模型 184
7.1 多项式回归 185
7.2 阶梯函数 186
7.3 基函数 187
7.4 回归样条 188
7.5 光滑样条 192
7.6 局部回归 194
7.7 广义可加模型 196
7.8 实验:非线性建模 200
7.9 习题 207
第8章 基于树的方法 211
8.1 决策树基本原理 211
8.2 装袋法、随机森林和提升法 219
8.3 实验:决策树 225
8.4 习题 231
第9章 支持向量机 234
9.1 最大间隔分类器 234
9.2 支持向量分类器 238
9.3 狭义的支持向量机 241
9.4 多分类的SVM 246
9.5 与逻辑斯谛回归的关系 247
9.6 实验:支持向量机 248
9.7 习题 256
第10章 无指导学习 259
10.1 无指导学习的挑战 259
10.2 主成分分析 260
10.3 聚类分析方法 267
10.4 实验1:主成分分析 277
10.5 实验2:聚类分析 280
10.6 实验3:以NCI60数据为例 282
10.7 习题 287