《博弈学习理论》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:(美)朱·弗登伯格(Drew Fudenberg),(美)戴维·K.莱文(David K.Levine)著;肖争艳,侯成琪译
  • 出 版 社:北京:中国人民大学出版社
  • 出版年份:2004
  • ISBN:7300057470
  • 页数:329 页
图书介绍:本书阐述博弈学习理论。

第1章 引论 1

1.1 前言 1

目录 1

1.2 大群体模型和匹配模型 4

1.3 三个常用的学习和/或进化模型 7

1.4 库诺特调整 8

1.5 库诺特动态分析 10

1.6 具有锁定功能的库诺特过程 11

1.7 回顾同时行动有限博弈 12

附录:动态系统和局部稳定性 25

参考文献 28

2.1 引言 33

第2章 虚拟行动 33

2.2 两人虚拟行动 35

2.3 虚拟行动中的渐近行动 37

2.4 对虚拟行动中循环的解释 40

2.5 多人虚拟行动 42

2.6 虚拟行动的支付 45

2.7 两战略博弈中的一致性和相关均衡 50

2.8 虚拟行动和最优反应动态 51

2.9 虚拟行动的一般化 53

附录:狄利克雷先验和多项抽样 55

参考文献 57

3.1 引言 60

第3章 模仿者动态和相关的确定性进化模型 60

3.2 同质群体中的模仿者动态 63

3.3 同质群体模仿者动态的稳定性 65

3.4 进化稳定战略 68

3.5 非对称模仿者动态模型 74

3.6 对模仿者动态方程的解释 77

3.7 模仿者动态的一般化和重复剔除严格劣战略 84

3.8 短视调整动态 89

3.9 集值极限点和漂移 95

3.10 廉价磋商和秘密握手 100

3.11 离散时间模仿者系统 102

附录:刘维尔(Liouville)定理 106

参考文献 108

第4章 随机虚拟行动和混合战略均衡 116

4.1 引言 116

4.2 收敛的概念 118

4.3 渐近短视和渐近经验主义 119

4.4 随机扰动支付与平滑最优反应 120

4.5 平滑虚拟行动和随机逼近 125

4.6 部分抽样 129

4.7 普遍一致性和平滑虚拟行动 132

4.8 刺激反应和作为学习模型的虚拟行动 137

4.9 对战略空间的学习 145

附录:随机逼近理论 146

参考文献 150

第5章 具有持续随机性的调整模型 157

5.1 引言 157

5.2 回顾随机调整模型 158

5.3 坎多里一迈拉斯一罗布(Kandori-Mailath-Rob)模型 162

5.4 讨论其他动态 167

5.5 局部相互作用 170

5.6 吸引域的半径和协半径 175

5.7 修正的协半径 179

5.8 具有异质群体的一致随机匹配 182

5.9 随机模仿者动态 185

附录A:有限马尔可夫链的回顾 190

附录B:随机稳定分析 193

参考文献 195

第6章 扩展式博弈和自确认均衡 201

6.1 引言 201

6.2 一个例子 203

6.3 扩展式博弈 204

6.4 一个简单的学习模型 206

6.5 自确认均衡的稳定性 210

6.6 异质的自确认均衡 212

6.7 一致自确认均衡 213

6.8 一致自确认均衡与纳什均衡 215

6.9 可理性化的自确认均衡和关于对手支付的先验信息 218

参考文献 226

7.1 引言 231

第7章 纳什均衡,大群体模型和扩展式博弈中的变异 231

7.2 相关信息集和纳什均衡 233

7.3 外生试验 234

7.4 在被比做吃角子老虎机问题的博弈中的学习 239

7.5 定态学习 244

7.6 “快速学习”模型中的随机调整和后向归纳 248

7.7 廉价磋商博弈中的变异和快速学习 255

7.8 试验和期限的长度 258

附录:吃角子老虎机问题回顾 260

参考文献 262

第8章 老练学习 266

8.1 引言 266

8.2 条件学习的三个范例 269

8.3 老练学习的贝叶斯方法 270

8.4 绝对连续条件的解释 274

8.5 选择专家 277

8.6 条件学习 280

8.7 折现 283

8.8 分类策略和循环 286

8.9 内省的分类规则,校准和相关均衡 290

8.10 模式识别中的索斯诺模型 295

8.11 操纵学习程序 297

参考文献 303

索引 309