第1章 贝叶斯推断的哲学 1
1.1引言 1
1.1.1贝叶斯思维 1
1.1.2贝叶斯推断在实践中的运用 3
1.1.3频率派的模型是错误的吗? 4
1.1.4关于大数据 4
1.2我们的贝叶斯框架 5
1.2.1不得不讲的实例:抛硬币 5
1.2.2实例:图书管理员还是农民 6
1.3概率分布 8
1.3.1离散情况 9
1.3.2连续情况 10
1.3.3什么是λ 12
1.4使用计算机执行贝叶斯推断 12
1.4.1实例:从短信数据推断行为 12
1.4.2介绍我们的第一板斧:PyMC 14
1.4.3说明 18
1.4.4后验样本到底有什么用? 18
1.5结论 20
1.6补充说明 20
1.6.1从统计学上确定两个λ值是否真的不一样 20
1.6.2扩充至两个转折点 22
1.7习题 24
1.8答案 24
第2章 进一步了解PyM C 27
2.1引言 27
2.1.1 父变量与子变量的关系 27
2.1.2 PyMC变量 28
2.1.3在模型中加入观测值 31
2.1.4最后 33
2.2建模方法 33
2.2.1同样的故事,不同的结局 35
2.2.2实例:贝叶斯A/B测试 38
2.2.3一个简单的场景 38
2.2.4 A和B一起 41
2.2.5实例:一种人类谎言的算法 45
2.2.6二项分布 45
2.2.7实例:学生作弊 46
2.2.8另一种PyMC模型 50
2.2.9更多的PyM C技巧 51
2.2.10实例:挑战者号事故 52
2.2.11正态分布 55
2.2.12挑战者号事故当天发生了什么? 61
2.3我们的模型适用吗? 61
2.4结论 68
2.5 补充说明 68
2.6习题 69
2.7答案 69
第3章 打开MCMC的黑盒子 71
3.1贝叶斯景象图 71
3.1.1使用MCMC来探索景象图 77
3.1.2 MCMC算法的实现 78
3.1.3后验的其他近似解法 79
3.1.4实例:使用混合模型进行无监督聚类 79
3.1.5不要混淆不同的后验样本 88
3.1.6使用MAP来改进收敛性 91
3.2收敛的判断 92
3.2.1自相关 92
3.2.2稀释 95
3.2.3 pymc.Matplot.plot() 97
3.3 MCMC的一些秘诀 98
3.3.1聪明的初始值 98
3.3.2先验 99
3.3.3统计计算的无名定理 99
3.4结论 99
第4章 从未言明的最伟大定理 101
4.1引言 101
4.2大数定律 101
4.2.1直觉 101
4.2.2实例:泊松随机变量的收敛 102
4.2.3如何计算 Var(Z) 106
4.2.4期望和概率 106
4.2.5所有这些与贝叶斯统计有什么关系呢 107
4.3小数据的无序性 107
4.3.1实例:地理数据聚合 107
4.3.2实例:Kaggle的美国人口普查反馈比例预测比赛 109
4.3.3实例:如何对Reddit网站上的评论进行排序 111
4.3.4排序! 115
4.3.5但是这样做的实时性太差了 117
4.3.6推广到评星系统 122
4.4结论 122
4.5补充说明 122
4.6习题 123
4.7答案 124
第5章 失去一只手臂还是一条腿 127
5.1 引言 127
5.2损失函数 127
5.2.1现实世界中的损失函数 129
5.2.2实例:优化“价格竞猜”游戏的展品出价 130
5.3机器学习中的贝叶斯方法 138
5.3.1实例:金融预测 139
5.3.2实例:Kaggle观测暗世界大赛 144
5.3.3数据 145
5.3.4先验 146
5.3.5训练和PyMC实现 147
5.4结论 156
第6章 弄清楚先验 157
6.1引言 157
6.2主观与客观先验 157
6.2.1客观先验 157
6.2.2主观先验 158
6.2.3决策,决策…… 159
6.2.4经验贝叶斯 160
6.3需要知道的有用的先验 161
6.3.1 Gamma分布 161
6.3.2威沙特分布 162
6.3.3 Beta分布 163
6.4实例:贝叶斯多臂老虎机 164
6.4.1应用 165
6.4.2一个解决方案 165
6.4.3好坏衡量标准 169
6.4.4扩展算法 173
6.5从领域专家处获得先验分布 176
6.5.1试验轮盘赌法 176
6.5.2实例:股票收益 177
6.5.3对于威沙特分布的专业提示 184
6.6共轭先验 185
6.7杰弗里斯先验 185
6.8当N增加时对先验的影响 187
6.9结论 189
6.10补充说明 190
6.10.1带惩罚的线性回归的贝叶斯视角 190
6.10.2 选择退化的先验 192
第7章 贝叶斯A/B测试 195
7.1引言 195
7.2转化率测试的简单重述 195
7.3增加一个线性损失函数 198
7.3.1收入期望的分析 198
7.3.2延伸到A/B测试 202
7.4超越转化率:t检验 204
7.4.1 t检验的设定 204
7.5增幅的估计 207
7.5.1创建点估计 210
7.6结论 211
术语表 213