《贝叶斯统计方法 R和BUGS软件数据分析示例》PDF下载

  • 购买积分:19 如何计算积分?
  • 作  者:(美)约翰·K·克鲁斯克(JohnK.Kruschke)著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2015
  • ISBN:9787111504467
  • 页数:653 页
图书介绍:作者从概率统计和编程两方面入手,由浅入深地指导读者如何对实际数据进行贝叶斯分析。全书分成三部分,第一部分为基础篇:关于参数、概率、贝叶斯法则及R软件,第二部分为二元比例推断的基本理论,第三部分为广义线性模型。内容包括贝叶斯统计的基本理论、实验设计的有关知识、以层次模型和MCMC为代表的复杂方法等。同时覆盖所有需要用到非贝叶斯方法的情况,其中包括:t-检验,方差分析(ANOVA)和ANOVA中的多重比较法,多元线性回归,Logistic回归,序列回归和卡方(列联表)分析。针对不同的学习目标(如R、BUGS等)列出了相应的重点章节;整理出贝叶斯统计中某些与传统统计学可作类比的内容,方便读者快速学习。本中提出的方法都是可操作的,并且所有涉及数学理论的地方都已经用实际例子非常直观地进行了解释。由于并不对读者的统计或编程基础有较高的要求,因此本书非常适合社会学或生物学研究者入门参考,同时也可作为相关科研人员的参考书。

第1章 关于本书 1

1.1 目标读者 1

1.2 预备知识 2

1.3 本书结构 3

1.3.1 重点章节 4

1.3.2 与贝叶斯方法对应的传统检验方法 4

1.4 期待反馈 6

1.5 致谢 6

第1部分 基础篇:关于参数、概率、贝叶斯法则及R软件 9

第2章 我们所信的模型 9

2.1 观测模型与信念模型 10

2.1.1 先验信念与后验信念 12

2.2 统计推断的三个目标 12

2.2.1 参数估计 13

2.2.2 数值预测 13

2.2.3 模型比较 13

2.3 R编程基础 14

2.3.1 软件的获取和安装 15

2.3.2 激活R和命令行使用 15

2.3.3 应用实例 16

2.3.4 获取帮助 17

2.3.5 编程 18

2.4 练习 20

第3章 概率究竟是什么? 23

3.1 所有可能事件的集合 24

3.1.1 抛硬币实验 25

3.2 概率:意识之外 25

3.2.1 意识之外:长期相对频率 25

3.2.2 意识以内:主观信念 28

3.2.3 概率:量化可能性 29

3.3 概率分布 30

3.3.1 离散分布:概率质量 30

3.3.2 连续分布:密度初探 31

3.3.3 分布的均值与方差 37

3.3.4 反映信念不确定性的方差 39

3.3.5 最高密度区间(HDI) 40

3.4 双变量联合分布 42

3.4.1 边际概率 43

3.4.2 条件概率 44

3.4.3 独立事件 46

3.5 R代码 47

3.5.1 图3.1 的R代码 47

3.5.2 图3.3 的R代码 48

3.6 练习 49

第4章 贝叶斯公式 51

4.1 贝叶斯公式简介 52

4.1.1 从条件概率的定义导出 53

4.1.2 受双因素表的启发 54

4.1.3 连续情形下的积分表达 56

4.2 在模型和数据中的应用 56

4.2.1 数据的顺序不变性 59

4.2.2 一个例子:抛硬币 60

4.3 推断的三个目标 63

4.3.1 参数估计 63

4.3.2 数值预测 63

4.3.3 模型比较 64

4.3.4 为什么贝叶斯推断是困难的 67

4.3.5 贝叶斯推断在日常生活中的应用 68

4.4 R代码 69

4.4.1 图4.1的R代码 69

4.5 练习 71

第2部分 用于二元比例推断的基本理论 77

第5章 二元比例推断的精确数学分析方法 77

5.1 伯努利分布的似然函数 78

5.2 贝塔分布简介 80

5.2.1 先验贝塔分布 81

5.2.2 后验贝塔分布 84

5.3 推断的三个目标 85

5.3.1 二元比例的估计 85

5.3.2 预测数据 87

5.3.3 模型比较 88

5.4 总结:如何做贝叶斯推断 90

5.5 R代码 91

5.5.1 图5.2 的R代码 91

5.6 练习 95

第6章 二元比例推断的格点估计法 101

6.1 θ取值离散时的贝叶斯准则 102

6.2 连续先验密度的离散化 102

6.2.1 离散化先验密度的例子 104

6.3 估计 106

6.4 序贯数据的预测 107

6.5 模型比较 108

6.6 总结 109

6.7 R代码 109

6.7.1 图6.2 及类似图形的R代码 109

6.8 练习 112

第7章 二元比例推断的Metropo1is算法 117

7.1 Metropolis算法的简单例子 119

7.1.1 政治家巧遇Metropolis算法 119

7.1.2 随机游走 120

7.1.3 随机游走的性质 122

7.1.4 为什么关注随机游走 125

7.1.5 Metropolis算法是如何起作用的 126

7.2 Metropolis算法的详细介绍 129

7.2.1 预烧、效率和收敛 131

7.2.2 术语:马尔可夫链-蒙特卡罗方法 132

7.3 从抽样后验分布到推断的三个目标 132

7.3.1 估计 134

7.3.2 预测 136

7.3.3 模型比较:p(D)的估计 137

7.4 BUGS的MCMC 139

7.4.1 用BUGS估计参数 140

7.4.2 用BUGS预测 143

7.4.3 用BUGS进行模型比较 145

7.5 结论 145

7.6 R代码 146

7.6.1 作者编写的Metropolis算法的R代码 146

7.7 练习 150

第8章 使用Gibbs抽样推断两个二元比例 155

8.1 两个比例的先验、似然和后验 157

8.2 后验分布的常规分析 159

8.3 使用格点估计近似后验分布 163

8.4 使用MCMC推断后验分布 165

8.4.1 Metropolis算法 165

8.4.2 Gibbs抽样 167

8.5 BUGS实现 173

8.5.1 在BUGS中抽样获取先验分布 174

8.6 潜在偏差有何差异? 175

8.7 总结 177

8.8 R代码 178

8.8.1 格点估计的R代码(图8.1和图8.2) 178

8.8.2 Metropolis抽样的R代码(图8.3) 181

8.8.3 BUGS抽样的R代码(图8.6) 184

8.8.4 画后验直方图的R代码 186

8.9 练习 188

第9章 多层先验下的伯努利似然 191

9.1 单个铸币厂生产的单枚硬币 192

9.1.1 通过网格近似得到后验估计1 196

9.2 单个铸币厂生产的多枚硬币 200

9.2.1 通过网格近似得到后验估计2 203

9.2.2 通过蒙特卡罗抽样得到后验估计 206

9.2.3 单枚铸币估计的离群和收缩 212

9.2.4 案例研究:触摸治疗 217

9.2.5 硬币数量及每枚硬币的抛掷次数 219

9.3 多个铸币厂生产的多枚硬币 219

9.3.1 独立铸币厂 219

9.3.2 非独立铸币厂 224

9.3.3 个体间差异及Meta分析 227

9.4 总结 228

9.5 R代码 228

9.5.1 触摸治疗实验的分析代码 228

9.5.2 过滤冷凝实验的分析代码 231

9.6 练习 235

第10章 分层建模和模型比较 241

10.1 多层模型的模型比较 241

10.2 BUGS中的模型比较 244

10.2.1 一个简单的例子 244

10.2.2 带有伪先验的真实例子 246

10.2.3 在使用带有伪先验的跨维度MCMC时的一些建议 253

10.3 嵌套模型的模型比较 254

10.4 模型比较的分层框架回顾 256

10.4.1 MCMC模型比较的比较方法 257

10.4.2 总结和警告 258

10.5 练习 259

第11章 原假设显著性检验(NHST) 265

11.1 硬币是否均匀的NHST 267

11.1.1 固定N的情况 267

11.1.2 固定z的情况 270

11.1.3 自我反省 272

11.1.4 贝叶斯分析 274

11.2 关于硬币的先验信息 274

11.2.1 NHST分析 275

11.2.2 贝叶斯分析 275

11.3 置信区间和最高密度区间(HDI) 277

11.3.1 NHST置信区间 277

11.3.2 贝叶斯HDI 280

11.4 多重假设 281

11.4.1 对实验误差的NHST修正 282

11.4.2 唯一的贝叶斯后验结论 284

11.4.3 贝叶斯分析如何减少误报 285

11.5 怎样的抽样分布才是好的 286

11.5.1 确定实验方案 286

11.5.2 探索模型预测(后验预测校验) 287

11.6 练习 288

第12章 单点检验的贝叶斯方法 295

12.1 单一先验的估计方法 296

12.1.1 参数的原假设值是否在可信范围内? 297

12.1.2 差异的原假设值是否在可信范围内? 297

12.1.3 实际等值区域(ROPE) 301

12.2 两个模型的先验比较方法 303

12.2.1 两枚硬币的均匀性是否相同? 303

12.2.2 不同组之间是否有差异? 307

12.3 模型比较的估计 310

12.3.1 原假设值为真的概率是多少? 310

12.3.2 建议 311

12.4 R代码 312

12.4.1 图12.5 的R代码 312

12.5 练习 314

第13章 目标、势和样本量 319

13.1 势的相关内容 320

13.1.1 目标和障碍 320

13.1.2 势 321

13.1.3 样本量 323

13.1.4 目标的其他表现形式 325

13.2 一枚硬币的样本量 326

13.2.1 以否定原假设值为目的 326

13.2.2 以精确为目的 327

13.3 检验多家铸币厂的样本量 329

13.4 势:预期、回顾和重复 331

13.4.1 势分析需要逼真的模拟数据 333

13.5 计划的重要性 334

13.6 R代码 335

13.6.1 一枚硬币的样本量 335

13.6.2 检验多家铸币厂的势和样本量 338

13.7 练习 346

第3部分 广义线性模型的应用 357

第14章 广义线性模型概述 357

14.1 广义线性模型(GLM) 358

14.1.1 预测变量和响应变量 358

14.1.2 变量尺度类型:定量、顺序和名义 359

14.1.3 一元线性回归 361

14.1.4 多元线性回归 364

14.1.5 预测变量的非线性交互作用 366

14.1.6 名义型预测变量 368

14.1.7 链接函数 373

14.1.8 概率预测 377

14.1.9 GLM的正则表达 379

14.1.10 两个或多个名义型变量预测频率 381

14.2 GLM的案例 383

14.3 练习 386

第15章 单总体的参数估计 389

15.1 通过正态似然估计总体均值和标准差 390

15.1.1 数学分析解法 392

15.1.2 在BUGS软件中应用马尔可夫链-蒙特卡罗方法逼近 395

15.1.3 离群点和稳健估计方法:t分布 397

15.1.4 当数据非正态时:变换 399

15.2 重复测量和个体差异 403

15.2.1 分层模型 405

15.2.2 在BUGS软件中实现 407

15.3 总结 408

15.4 R代码 409

15.4.1 通过正态似然估计总体均值和标准差 409

15.4.2 重复测量 411

15.5 练习 414

第16章 一元回归 419

16.1 简单线性回归 420

16.1.1 分层模型和BUGS代码 422

16.1.2 斜率的后验分布 426

16.1.3 后验概率预测 427

16.2 离群点和稳健回归方法 430

16.3 简单线性回归的重复测量 433

16.4 总结 437

16.5 R代码 437

16.5.1 生成身高和体重的数据 437

16.5.2 BRugs:稳健线性回归 439

16.5.3 BRugs:简单线性回归的重复测量 442

16.6 练习 446

第17章 多元回归 453

17.1 多元线性回归 454

17.1.1 相关预测变量的影响 454

17.1.2 模型和BUGS程序 458

17.1.3 斜率的后验分布 460

17.1.4 后验概率预测 462

17.2 超先验信息和回归系数的收缩 463

17.2.1 先验信息、稀疏数据和相关预测变量 467

17.3 定量预测变量的交互作用 469

17.3.1 分层模型和BUGS代码 470

17.3.2 解释后验信息 472

17.4 预测变量选择 476

17.5 R代码 478

17.5.1 多元线性回归 478

17.5.2 系数具有超先验信息的多元线性回归 483

17.6 练习 488

第18章 单因素方差分析 491

18.1 贝叶斯单因素方差分析 492

18.1.1 分层先验信息 493

18.1.2 在R软件和BUGS软件中实现 495

18.1.3 一个案例 497

18.2 多重比较 502

18.3 两总体的贝叶斯方差分析和显著性t检验 506

18.4 R代码 507

18.4.1 贝叶斯单因素方差分析 507

18.5 练习 512

第19章 定量因变量与多元定性预测变量 515

19.1 贝叶斯多元方差分析 516

19.1.1 定性预测变量的相互作用 517

19.1.2 分层次的先验分布 519

19.1.3 R软件和BUGS软件中的一个例子 520

19.1.4 后验结果的解释 522

19.1.5 无相互作用性,数据变换,方差一致性 528

19.2 重复测量——受测者内设计 531

19.2.1 为什么使用受测者内设计,为什么不使用? 533

19.3 R代码 535

19.3.1 贝叶斯双因素的方差分析 535

19.4 练习 544

第20章 二分类因变量 549

20.1 Logistic回归 550

20.1.1 模型 551

20.1.2 在R软件和BUGS软件中实现 553

20.1.3 后验结果的解释 553

20.1.4 预测变量相关性对模型的影响 555

20.1.5 数据不平衡性 556

20.1.6 回归系数的超先验分布 556

20.2 Logistic回归模型预测变量的相互作用 556

20.3 Logistic方差模型 557

20.3.1 受测者内设计 561

20.4 总结 561

20.5 R代码 562

20.5.1 Logistic回归模型代码 562

20.5.2 Logistic方差模型代码 567

20.6 练习 572

第21章 定序因变量建模 575

21.1 定序Probit回归模型 576

21.1.1 数据的结构 576

21.1.2 定量x与定序y的映射 577

21.1.3 模型参数与其先验分布 578

21.1.4 MCMC效率的标准化 579

21.1.5 后验结果的预测 580

21.2 一些例子 581

21.2.1 为什么一些阈值会超出数据范围 584

21.3 预测变量相互作用 588

21.4 线性回归与Logistic回归模型的关系 588

21.5 R代码 589

21.6 练习 594

第22章 列联表分析 597

22.1 泊松指数方差模型 598

22.1.1 数据是什么? 598

22.1.2 指数链接函数 599

22.1.3 泊松似然 601

22.1.4 模型参数与分层先验分布 603

22.2 一些例子 604

22.2.1 网格概率的置信区间 605

22.3 列联表对数线性模型 607

22.4 泊松指数模型的R代码 608

22.5 练习 616

第23章 补充主题 619

23.1 贝叶斯分析报告 620

23.1.1 关键元素 620

23.1.2 可选内容 621

23.1.3 其他要点 622

23.2 MCMC的加厚和稀化 623

23.3 估计最高密度区间函数 626

23.3.1 R代码:格点估计HDI的计算 626

23.3.2 R代码:MCMC抽样HDI的计算 627

23.3.3 R代码:函数HDI的计算 629

23.4 概率分布的重新参数化 630

23.4.1 示例 631

23.4.2 两参数的重新参数化 632

参考文献 633

索引 639