《博弈学习理论》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:陈学彬编著
  • 出 版 社:上海:上海财经大学出版社
  • 出版年份:1999
  • ISBN:7810493205
  • 页数:317 页
图书介绍:本书由上海财经大学出版基金资助出版。本书重点介绍90年代发展起来的博弈学习理论的基本内容,主要介绍原著者的观点,内容包括:基本的博弈学习模型,虚拟行动,模仿者动态与相关的进化模型,自确认均衡、老练学习、学习与有限预测均衡、再发生博弈中的社会学习和对学习的福利分析及市场进入和重复谈判博弈中学习效应的实验研究,等等。本书特点在新颖性,但所涉及的专业性较强,在总体风格上体现了当代经济学的前沿性特点。

1 引言 1

1.1 博弈学习理论:分析博弈演变及其均衡的重要方法 1

1.2 基本的博弈学习模型 5

1.2.1 三个普通的学习或进化模型 5

1.2.2 大群体和匹配模型 6

1.3 库诺特调整 10

1.3.1 库诺特动态分析 11

1.3.2 具有锁定功能的库诺特过程 12

1.4 本书的内容和结构 14

2 虚拟行动 19

2.1 引言 19

2.2 确定性两人虚拟行动 21

2.2.1 基本模型 21

2.2.2 虚拟行动中的渐近行动 23

2.2.3 对虚拟行动中循环的解释 27

2.3 确定性多人虚拟行动 29

2.3.1 基本模型 29

2.3.2 虚拟行动中的收益 32

2.3.3 在两策略博弈中的一致性和相关均衡 35

2.4 确定性虚拟行动的一般化 36

2.4.1 确定性虚拟行动和最优反应动态 36

2.4.2 确定性虚拟行动的一般化 38

2.5 随机虚拟行动与混合策略均衡 40

2.5.1 收敛性的概念 41

2.5.2 渐近近视与渐近经验主义 42

2.5.3 随机扰动收益与平滑最优反应 44

2.5.4 平滑虚拟行动和随机近似 45

2.5.5 部分抽样 50

2.5.6 普通一致性和平滑虚拟行动 53

2.6 作为学习模型的激励反应和虚拟行动 55

2.6.1 具有负强化的激励反应 56

2.6.2 实验证据 58

2.6.3 学习效应 59

2.6.4 作为激励反应模型的虚拟行动 60

2.6.5 学习策略空间 62

3 模仿者动态与相关的进化模型 64

3.1 引言 64

3.2 同类群体的模仿者动态模型 65

3.2.1 重复动态博弈模型 65

3.2.2 同类群体模仿者动态模型的稳定性 67

3.3 进化稳定策略与非对称模仿者模型 71

3.3.1 进化稳定策略 71

3.3.2 非对称模仿者模型 76

3.4 模仿者动态的经济学解释 79

3.4.1 回顾 79

3.4.2 社会学习模型 80

3.4.3 刺激反应模型 85

3.5 具有持续随机性的调整模型 87

3.5.1 随机调整模型概述 87

3.5.2 Kandori-Mailath-Rob模型 91

3.6 非同类群体的随机匹配与随机模仿者动态 95

3.6.1 非同类群体的随机匹配 95

3.6.2 随机模仿者动态 98

3.7 学习的具体策略障碍和非单调选择动态 103

3.7.1 引言 103

3.7.2 选择动态学 105

3.7.3 模仿者动态的一般化 108

3.7.4 周期性的轨道 111

3.7.5 劣策略 115

4 自确认均衡 119

4.1 引言 119

4.2 简单的学习模型 120

4.2.1 一个例子 120

4.2.2 信念 122

4.2.3 给定信念的行为 123

4.2.4 均衡概念 124

4.3 自确认均衡的稳定性和非齐次自确认均衡 126

4.3.1 自确认均衡的稳定性 126

4.3.2 非齐次自确认均衡 127

4.4 一致自确认均衡与纳什均衡 129

4.4.1 一致自确认均衡 129

4.4.2 一致自确认均衡与纳什均衡 131

4.5 可理性化的自确认均衡和关于对手收益的事前信息 135

4.5.1 引言 135

4.5.2 闭信念集和扩展式可理性化 138

4.5.3 稳健性 140

4.5.4 例4.1 的再分析 141

5 老练学习 143

5.1 引言 143

5.2 三种老练学习模式 145

5.2.1 老练学习的贝叶斯方法 145

5.2.2 专家的选择 149

5.2.3 条件学习 151

5.3 老练学习的稳定性和复杂性 153

5.3.1 老练学习将导致复杂动态学 153

5.3.2 老练学习的稳定性 156

5.4 校准学习和相关均衡 159

5.4.1 引言 159

5.4.2 表达法和定义 162

5.4.3 校准与相关均衡 164

5.4.4 SHAPLEY博弈与虚拟行动 168

5.5 操纵学习过程 172

5.5.1 信誉模型 173

5.5.2 在大群体中的引导 174

6 学习与有限预测均衡 179

6.1 引言 179

6.2 有限预测均衡 182

6.2.1 模型 182

6.2.2 有限预测均衡 183

6.3 学习和有限预测 187

6.3.1 错误 188

6.3.2 信念状态和预测规则 188

6.3.3 行动和信念状态 189

6.3.4 更新信念状态 189

6.3.5 初始化 191

6.4 学习实施(n1,n2)-解 191

6.4.1 无颤抖的吸收集 192

6.4.2 随机稳定集 193

6.4.3 一个例子 194

6.5 讨论 196

6.5.1 关于似然性水平量的有限性 196

6.5.2 最似然预测规则的唯一性 197

6.5.3 存在许多最似然预测规则时的随机选择 198

6.5.4 关于错误 198

6.5.5 关于预测规则 199

6.5.6 结论 200

7 再发生博弈中的社会学习和对学习的福利分析 201

7.1 引言 201

7.2 激励举例和再发生博弈定义 206

7.2.1 激励举例 206

7.2.2 再发生博弈 209

7.2.3 不确定再发生博弈 211

7.2.4 概率空间 211

7.2.5 不确定再发生博弈中的均衡 212

7.3 社会学习及其收敛 212

7.3.1 社会学习 212

7.3.2 社会学习隐含私人学习和向贝叶斯均衡的收敛 213

7.3.3 为完美行动而学习 222

7.3.4 小结 227

7.4 学习的福利分析 233

7.4.1 引言 233

7.4.2 模型 236

7.4.3 市场学习 237

7.4.4 最优学习 240

7.4.5 一个变量:短期代理人 245

7.4.6 小结 247

8 市场进入和重复谈判博弈中学习效应的实验研究 250

8.1 市场进入博弈学习模型及其实验设计 250

8.1.1 引言 250

8.1.2 市场进入博弈 251

8.1.3 Roth-Erev适应性学习模型 255

8.1.4 实验设计 257

8.2 市场进入博弈实验结果分析 260

8.2.1 总体评述 260

8.2.2 存在免费学习神话吗? 262

8.2.3 观察到的学习过程 263

8.2.4 信息条件影响的可选解释 264

8.2.5 强化学习模型的外部参考点变量模拟 265

8.2.6 主体使用基于模仿的还是预期的规则 266

8.3 重复谈判博弈中的学习效应实验研究 268

8.3.1 引言 268

8.3.2 麻醉效应和学习的实证研究回顾 270

8.3.3 无仲裁者和等概率仲裁者的实验设计 272

8.4 无仲裁者和等概率仲裁者的实验分析 276

8.4.1 初步分析 276

8.4.2 回合效应与结果学习 278

8.4.3 结果学习模型的麻醉效应测试 281

8.4.4 解决方案和阶段策略 282

8.4.5 进一步的分析 284

8.4.6 总结 290

参考文献 293

中英文人名对照 311

后记 317