![博弈学习理论](https://cover.qianqiantushu.cc/34/s6e2ba56.jpg)
![博弈学习理论](https://cover.qianqiantushu.cc/34/s6e2ba56.jpg)
博弈学习理论PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:陈学彬编著
- 出 版 社:上海:上海财经大学出版社
- 出版年份:1999
- ISBN:7810493205
- 页数:317 页
1 引言 1
1.1 博弈学习理论:分析博弈演变及其均衡的重要方法 1
1.2 基本的博弈学习模型 5
1.2.1 三个普通的学习或进化模型 5
1.2.2 大群体和匹配模型 6
1.3 库诺特调整 10
1.3.1 库诺特动态分析 11
1.3.2 具有锁定功能的库诺特过程 12
1.4 本书的内容和结构 14
2 虚拟行动 19
2.1 引言 19
2.2 确定性两人虚拟行动 21
2.2.1 基本模型 21
2.2.2 虚拟行动中的渐近行动 23
2.2.3 对虚拟行动中循环的解释 27
2.3 确定性多人虚拟行动 29
2.3.1 基本模型 29
2.3.2 虚拟行动中的收益 32
2.3.3 在两策略博弈中的一致性和相关均衡 35
2.4 确定性虚拟行动的一般化 36
2.4.1 确定性虚拟行动和最优反应动态 36
2.4.2 确定性虚拟行动的一般化 38
2.5 随机虚拟行动与混合策略均衡 40
2.5.1 收敛性的概念 41
2.5.2 渐近近视与渐近经验主义 42
2.5.3 随机扰动收益与平滑最优反应 44
2.5.4 平滑虚拟行动和随机近似 45
2.5.5 部分抽样 50
2.5.6 普通一致性和平滑虚拟行动 53
2.6 作为学习模型的激励反应和虚拟行动 55
2.6.1 具有负强化的激励反应 56
2.6.2 实验证据 58
2.6.3 学习效应 59
2.6.4 作为激励反应模型的虚拟行动 60
2.6.5 学习策略空间 62
3 模仿者动态与相关的进化模型 64
3.1 引言 64
3.2 同类群体的模仿者动态模型 65
3.2.1 重复动态博弈模型 65
3.2.2 同类群体模仿者动态模型的稳定性 67
3.3 进化稳定策略与非对称模仿者模型 71
3.3.1 进化稳定策略 71
3.3.2 非对称模仿者模型 76
3.4 模仿者动态的经济学解释 79
3.4.1 回顾 79
3.4.2 社会学习模型 80
3.4.3 刺激反应模型 85
3.5 具有持续随机性的调整模型 87
3.5.1 随机调整模型概述 87
3.5.2 Kandori-Mailath-Rob模型 91
3.6 非同类群体的随机匹配与随机模仿者动态 95
3.6.1 非同类群体的随机匹配 95
3.6.2 随机模仿者动态 98
3.7 学习的具体策略障碍和非单调选择动态 103
3.7.1 引言 103
3.7.2 选择动态学 105
3.7.3 模仿者动态的一般化 108
3.7.4 周期性的轨道 111
3.7.5 劣策略 115
4 自确认均衡 119
4.1 引言 119
4.2 简单的学习模型 120
4.2.1 一个例子 120
4.2.2 信念 122
4.2.3 给定信念的行为 123
4.2.4 均衡概念 124
4.3 自确认均衡的稳定性和非齐次自确认均衡 126
4.3.1 自确认均衡的稳定性 126
4.3.2 非齐次自确认均衡 127
4.4 一致自确认均衡与纳什均衡 129
4.4.1 一致自确认均衡 129
4.4.2 一致自确认均衡与纳什均衡 131
4.5 可理性化的自确认均衡和关于对手收益的事前信息 135
4.5.1 引言 135
4.5.2 闭信念集和扩展式可理性化 138
4.5.3 稳健性 140
4.5.4 例4.1 的再分析 141
5 老练学习 143
5.1 引言 143
5.2 三种老练学习模式 145
5.2.1 老练学习的贝叶斯方法 145
5.2.2 专家的选择 149
5.2.3 条件学习 151
5.3 老练学习的稳定性和复杂性 153
5.3.1 老练学习将导致复杂动态学 153
5.3.2 老练学习的稳定性 156
5.4 校准学习和相关均衡 159
5.4.1 引言 159
5.4.2 表达法和定义 162
5.4.3 校准与相关均衡 164
5.4.4 SHAPLEY博弈与虚拟行动 168
5.5 操纵学习过程 172
5.5.1 信誉模型 173
5.5.2 在大群体中的引导 174
6 学习与有限预测均衡 179
6.1 引言 179
6.2 有限预测均衡 182
6.2.1 模型 182
6.2.2 有限预测均衡 183
6.3 学习和有限预测 187
6.3.1 错误 188
6.3.2 信念状态和预测规则 188
6.3.3 行动和信念状态 189
6.3.4 更新信念状态 189
6.3.5 初始化 191
6.4 学习实施(n1,n2)-解 191
6.4.1 无颤抖的吸收集 192
6.4.2 随机稳定集 193
6.4.3 一个例子 194
6.5 讨论 196
6.5.1 关于似然性水平量的有限性 196
6.5.2 最似然预测规则的唯一性 197
6.5.3 存在许多最似然预测规则时的随机选择 198
6.5.4 关于错误 198
6.5.5 关于预测规则 199
6.5.6 结论 200
7 再发生博弈中的社会学习和对学习的福利分析 201
7.1 引言 201
7.2 激励举例和再发生博弈定义 206
7.2.1 激励举例 206
7.2.2 再发生博弈 209
7.2.3 不确定再发生博弈 211
7.2.4 概率空间 211
7.2.5 不确定再发生博弈中的均衡 212
7.3 社会学习及其收敛 212
7.3.1 社会学习 212
7.3.2 社会学习隐含私人学习和向贝叶斯均衡的收敛 213
7.3.3 为完美行动而学习 222
7.3.4 小结 227
7.4 学习的福利分析 233
7.4.1 引言 233
7.4.2 模型 236
7.4.3 市场学习 237
7.4.4 最优学习 240
7.4.5 一个变量:短期代理人 245
7.4.6 小结 247
8 市场进入和重复谈判博弈中学习效应的实验研究 250
8.1 市场进入博弈学习模型及其实验设计 250
8.1.1 引言 250
8.1.2 市场进入博弈 251
8.1.3 Roth-Erev适应性学习模型 255
8.1.4 实验设计 257
8.2 市场进入博弈实验结果分析 260
8.2.1 总体评述 260
8.2.2 存在免费学习神话吗? 262
8.2.3 观察到的学习过程 263
8.2.4 信息条件影响的可选解释 264
8.2.5 强化学习模型的外部参考点变量模拟 265
8.2.6 主体使用基于模仿的还是预期的规则 266
8.3 重复谈判博弈中的学习效应实验研究 268
8.3.1 引言 268
8.3.2 麻醉效应和学习的实证研究回顾 270
8.3.3 无仲裁者和等概率仲裁者的实验设计 272
8.4 无仲裁者和等概率仲裁者的实验分析 276
8.4.1 初步分析 276
8.4.2 回合效应与结果学习 278
8.4.3 结果学习模型的麻醉效应测试 281
8.4.4 解决方案和阶段策略 282
8.4.5 进一步的分析 284
8.4.6 总结 290
参考文献 293
中英文人名对照 311
后记 317
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《联吡啶基钌光敏染料的结构与性能的理论研究》李明霞 2019
- 《情报学 服务国家安全与发展的现代情报理论》赵冰峰著 2018
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《新课标背景下英语教学理论与教学活动研究》应丽君 2018
- 《党员干部理论学习培训教材 理论热点问题党员干部学习辅导》(中国)胡磊 2018
- 《虚拟流域环境理论技术研究与应用》冶运涛蒋云钟梁犁丽曹引等编著 2019
- 《当代翻译美学的理论诠释与应用解读》宁建庚著 2019
- 《环境影响评价公众参与理论与实践研究》樊春燕主编 2019
- 《深度学习与飞桨PaddlePaddle Fluid实战》于祥 2019
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019