《统计学习导论 基于R应用》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:(美)加雷斯·詹姆斯(GarethJames)著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2015
  • ISBN:9787111497714
  • 页数:292 页
图书介绍:本书概述了统计学习领域,提供了理解大数据和复杂数据必不可少的工具,这些数据来自近20年来生物学、金融学、市场营销学和天体物理学等领域。书中介绍了一些最重要的建模方法和预测技术,以及它们的相关应用。内容涉及线性回归、分类、再抽样方法、压缩方法、基于树的方法和聚类等,用彩图和实例来阐释相关方法。因为本教材的主要目标是方便自然科学、工业和其他领域的从业者使用统计学习技术,所以每章都有在R中实现所介绍的分析方法的指导内容。本书只假定读者先修《线性回归》课程,并不要求读者具有矩阵代数知识。读者对象是那些希望利用前沿的统计学习技术来分析数据的人士,既包括统计学专业的师生,也包括非统计学专业的人员。

第1章 导论 1

1.1 统计学习概述 1

1.2 统计学习简史 4

1.3 关于这本书 4

1.4 这本书适用的读者群 6

1.5 记号与简单的矩阵代数 6

1.6 本书的内容安排 8

1.7 用于实验和习题的数据集 9

1.8 本书网站 10

1.9 致谢 10

第2章 统计学习 11

2.1 什么是统计学习 11

2.2 评价模型精度 21

2.3 实验:R语言简介 30

2.4 习题 37

第3章 线性回归 41

3.1 简单线性回归 42

3.2 多元线性回归 49

3.3 回归模型中的其他注意事项 57

3.4 营销计划 70

3.5 线性回归与K最近邻法的比较 72

3.6 实验:线性回归 75

3.7 习题 84

第4章 分类 89

4.1 分类问题概述 89

4.2 为什么线性回归不可用 90

4.3 逻辑斯谛回归 91

4.4 线性判别分析 96

4.5 分类方法的比较 105

4.6 R实验:逻辑斯谛回归、LDA、QDA和KNN 107

4.7 习题 117

第5章 重抽样方法 121

5.1 交叉验证法 121

5.2 自助法 129

5.3 实验:交叉验证法和自助法 131

5.4 习题 136

第6章 线性模型选择与正则化 140

6.1 子集选择 141

6.2 压缩估计方法 148

6.3 降维方法 157

6.4 高维问题 163

6.5 实验1:子集选择方法 167

6.6 实验2:岭回归和lasso 173

6.7 实验3:PCR和PLS回归 177

6.8 习题 180

第7章 非线性模型 184

7.1 多项式回归 185

7.2 阶梯函数 186

7.3 基函数 187

7.4 回归样条 188

7.5 光滑样条 192

7.6 局部回归 194

7.7 广义可加模型 196

7.8 实验:非线性建模 200

7.9 习题 207

第8章 基于树的方法 211

8.1 决策树基本原理 211

8.2 装袋法、随机森林和提升法 219

8.3 实验:决策树 225

8.4 习题 231

第9章 支持向量机 234

9.1 最大间隔分类器 234

9.2 支持向量分类器 238

9.3 狭义的支持向量机 241

9.4 多分类的SVM 246

9.5 与逻辑斯谛回归的关系 247

9.6 实验:支持向量机 248

9.7 习题 256

第10章 无指导学习 259

10.1 无指导学习的挑战 259

10.2 主成分分析 260

10.3 聚类分析方法 267

10.4 实验1:主成分分析 277

10.5 实验2:聚类分析 280

10.6 实验3:以NCI60数据为例 282

10.7 习题 287