《统计学习基础 数据挖掘、推理与预测》PDF下载

  • 购买积分:13 如何计算积分?
  • 作  者:(美)Trevor Hastie等著;范明等译
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2004
  • ISBN:7505393316
  • 页数:381 页
图书介绍:计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战,这导致统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。许多工具都具有共同的基础,但常常用不同的术语表达。本书介绍这些领域的一些重要。尽管应用的是统计学方法,但强调的是概念,而不是数学。许多例子附以彩色图形。本书内容广泛,从有指导的学习(预测),到无指导的学习应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书中介绍得最全面的。

第1章 绪论 1

第2章 有指导学习概述 6

2.1 引言 6

2.2 变量类型和术语 6

2.3 两种简单预测方法:最小二乘方和最近邻法 7

2.4 统计判决理论 12

2.5 高维空间的局部方法 15

2.6 统计模型、有指导学习和函数逼近 19

2.7 结构化回归模型 22

2.8 受限的估计方法类 23

2.9 模型选择和偏倚-方差权衡 25

文献注释 26

习题 27

第3章 回归的线性方法 28

3.1 引言 28

3.2 线性回归模型和最小二乘方 28

3.3 从简单的一元回归到多元回归 34

3.4 子集选择和系数收缩 38

3.5 计算考虑 52

文献注释 52

习题 53

第4章 分类的线性方法 55

4.1 引言 55

4.2 指示矩阵的线性回归 56

4.3 线性判别分析 59

4.4 逻辑斯缔回归 67

4.5 分离超平面 73

文献注释 77

习题 78

第5章 基展开与正则化 80

5.1 引言 80

5.2 分段多项式和样条 81

5.3 过滤和特征提取 88

5.4 光滑样条 88

5.5 光滑参数的自动选择 91

5.6 无参逻辑斯缔回归 95

5.7 多维样条函数 96

5.8 正则化和再生核希尔伯特空间 100

5.9 小波光滑 104

文献注释 109

习题 110

第6章 核方法 115

6.1 一维核光滑方法 115

6.2 选择核的宽度 120

6.3 IRp上的局部回归 121

6.4 IRp上结构化局部回归模型 123

6.5 局部似然和其他模型 125

6.6 核密度估计和分类 126

6.7 径向基函数和核 129

6.8 密度估计和分类的混合模型 131

6.9 计算考虑 132

文献注释 133

习题 133

第7章 模型评估与选择 135

7.1 引言 135

7.2 偏倚、方差和模型复杂性 135

7.3 偏倚-方差分解 137

7.4 训练误差率的乐观性 140

7.5 样本内预测误差的估计 142

7.6 有效的参数个数 143

7.7 贝叶斯方法和BIC 144

7.8 最小描述长度 145

7.9 Vapnik-Chernovenkis维 147

7.10 交叉验证 149

7.11 自助法 152

文献注释 155

习题 155

第8章 模型推理和平均 158

8.1 引言 158

8.2 自助法和极大似然法 158

8.3 贝叶斯方法 162

8.4 自助法和贝叶斯推理之间的联系 165

8.5 EM算法 166

8.6 从后验中抽样的MCMC 171

8.7 装袋 173

8.8 模型平均和堆栈 176

8.9 随机搜索:冲击 178

文献注释 179

习题 180

第9章 加法模型、树和相关方法 181

9.1 广义加法模型 181

9.2 基于树的方法 187

9.3 PRIM——凸点搜索 195

9.4 MARS:多元自适应回归样条 199

9.5 分层专家混合 204

9.6 遗漏数据 206

9.7 计算考虑 207

文献注释 208

习题 208

第10章 提升和加法树 210

10.1 提升方法 210

10.2 提升拟合加法模型 213

10.3 前向分步加法建模 213

10.4 指数损失函数和AdaBoost 214

10.5 为什么使用指数损失 216

10.6 损失函数和健壮性 216

10.7 数据挖掘的“现货”过程 219

10.8 例:垃圾邮件数据 220

10.9 提升树 223

10.10 数值优化 224

10.11 提升适当大小的树 227

10.12 正则化 228

10.13 可解释性 232

10.14 实例 235

文献注释 241

习题 241

第11章 神经网络 243

11.1 引言 243

11.2 投影寻踪回归 243

11.3 神经网络 245

11.4 拟合神经网络 247

11.5 训练神经网络的一些问题 249

11.6 例:模拟数据 251

11.7 例:ZIP编码数据 253

11.8 讨论 257

11.9 计算考虑 257

文献注释 257

习题 258

第12章 支持向量机和柔性判别 259

12.1 引言 259

12.2 支持向量分类器 259

12.3 支持向量机 263

12.4 线性判别分析的推广 272

12.5 柔性判别分析 273

12.6 罚判别分析 277

12.7 混合判别分析 279

12.8 计算考虑 284

文献注释 284

习题 285

第13章 原型方法和最近邻 287

13.1 引言 287

13.2 原型方法 287

13.3 k-最近邻分类器 290

13.4 自适应的最近邻方法 298

13.5 计算考虑 302

文献注释 302

习题 302

第14章 无指导学习 305

14.1 引言 305

14.2 关联规则 306

14.3 聚类分析 316

14.4 自组织映射 335

14.5 主成分、曲线和曲面 339

14.6 独立成分分析和探测性投影寻踪 345

14.7 多维定标 350

文献注释 352

习题 352

术语表 356

参考文献 369