《数据科学与工程技术丛书 计算机时代的统计推断 算法、演化和数据科学》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:(美)布拉德利·埃夫隆,(美)特雷福·黑斯蒂著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2019
  • ISBN:9787111627524
  • 页数:296 页
图书介绍:本书以丰富的案例介绍了计算机时代下的统计推断的发展脉络,从理论的角度剖析统计推断的各类算法、证据等,揭示统计推断如何推动当今大数据、数据科学、机器学习等领域的快速发展并引领数据分析的变革,最后展望了统计学和数据科学的未来方向。

第一部分 经典统计推断 2

第1章 算法与推断 2

1.1 一个回归的例子 3

1.2 假设检验 5

1.3 注释 7

注释 7

第2章 频率学派推断 8

2.1 实践中的频率学派 9

2.2 频率学意义下的最优化 12

2.3 注释与细节 13

注释 13

第3章 贝叶斯推断 14

3.1 两个例子 15

3.2 无信息先验分布 18

3.3 频率学派推断的缺陷 19

3.4 贝叶斯学派/频率学派的对比列表 21

3.5 注释与细节 23

注释 23

第4章 Fisher推断和最大似然估计 24

4.1 似然和最大似然 24

4.2 Fisher信息和MLE 26

4.3 条件推断 28

4.4 排列和随机化 31

4.5 注释与细节 32

注释 32

第5章 参数模型和指数族 34

5.1 单变量族 34

5.2 多元正态分布 36

5.3 多参数分布族的Fisher信息量边界 38

5.4 多项分布 39

5.5 指数型分布族 41

5.6 注释与细节 44

注释 44

第二部分 计算机时代早期方法 48

第6章 经验贝叶斯 48

6.1 Robbins公式 48

6.2 物种遗漏问题 50

6.3 一个医学上的例子 54

6.4 间接证据1 56

6.5 注释与细节 57

注释 57

第7章 James-Stein估计和岭回归 59

7.1 James-Stein估计 59

7.2 棒球运动员 61

7.3 岭回归 63

7.4 间接证据2 66

7.5 注释和细节 68

注释 68

第8章 广义线性模型与回归树 70

8.1 逻辑回归 70

8.2 广义线性模型 75

8.3 泊松回归 78

8.4 回归树 80

8.5 注释与细节 82

注释 83

第9章 生存分析和EM算法 85

9.1 生命表和风险率 85

9.2 删失数据和Kaplan-Meier估计 87

9.3 对数秩检验 91

9.4 比例风险模型 93

9.5 缺失数据和EM算法 95

9.6 注释与细节 98

注释 98

第10章 刀切法与自助法 101

10.1 标准差的刀切法估计 101

10.2 非参数的自助法 103

10.3 重抽样方案 106

10.4 参数自助法 110

10.5 影响函数与鲁棒估计 112

10.6 注释与细节 115

注释 115

第11章 自助法置信区间 117

11.1 Neyman的单参数问题的构建 117

11.2 百分位方法 120

11.3 偏差校正置信区间 122

11.4 二阶精度 124

11.5 自助t-区间 126

11.6 目标贝叶斯区间和置信分布 127

11.7 注释与细节 131

注释 131

第12章 交叉验证与预测误差的Cp估计 134

12.1 预测规则 134

12.2 交叉验证 137

12.3 协方差惩罚 140

12.4 训练、验证与短期预测因子 146

12.5 注释与细节 148

注释 148

第13章 客观贝叶斯推断和马尔可夫链蒙特卡罗方法 150

13.1 客观先验分布 150

13.2 共轭先验分布 152

13.3 模型选择与贝叶斯信息准则 156

13.4 Gibbs抽样和MCMC 161

13.5 示例:模拟人口混合 165

13.6 注释与细节 167

注释 167

第14章 战后时代的统计推断与方法论 169

注释 171

第三部分 21世纪的话题 174

第15章 大规模假设检验和错误发现率 174

15.1 大规模假设检验 174

15.2 错误发现率 176

15.3 经验贝叶斯大规模假设检验 178

15.4 局部错误发现率 181

15.5 原假设分布的选择 183

15.6 关联性 186

15.7 注释与细节 188

注释 188

第16章 稀疏建模和套索 191

16.1 前向逐步回归 191

16.2 套索 194

16.3 拟合套索模型 197

16.4 最小角回归 198

16.5 拟合广义的套索模型 200

16.6 套索的选择后推断 202

16.7 联系和扩展 203

16.8 注释与细节 205

注释 205

第17章 随机森林和提升 207

17.1 随机森林 207

17.2 平方误差损失的提升 212

17.3 梯度提升 216

17.4 Adaboost:原始的提升算法 218

17.5 联系和扩展 220

17.6 注释与细节 221

注释 222

第18章 神经网络与深度学习 224

18.1 神经网络与手写数字问题 225

18.2 拟合一个网络 226

18.3 自动编码器 230

18.4 深度学习 231

18.5 学习一个深层网络 234

18.6 注释与细节 235

注释 236

第19章 支持向量机和核方法 238

19.1 最优超平面 238

19.2 软间隔分类器 240

19.3 作为损失加惩罚的支持向量机准则 241

19.4 计算以及核技巧 242

19.5 利用核的函数拟合 244

19.6 实例:用于蛋白质分类的字符串核函数 244

19.7 支持向量机:结束语 245

19.8 核平滑和局部回归 246

19.9 注释与细节 247

注释 248

第20章 模型选择后的推断 250

20.1 同时置信区间 251

20.2 模型选择后的准确率 255

20.3 选择的偏差 258

20.4 贝叶斯-频率学组合估计 260

20.5 注释与细节 263

注释 264

第21章 经验贝叶斯估计策略 266

21.1 贝叶斯反卷积 266

21.2 g-建模和估计 267

21.3 似然、正则化和准确性 269

21.4 两个例子 272

21.5 广义线性混合模型 276

21.6 反卷积和f-建模 278

21.7 注释与细节 280

注释 280

后记 282

参考文献 286