第一章 理论框架 3
1.1 导论和例子 3
1.2 博弈的扩展式表述 6
1.2.1 正式规定 6
1.2.2 例子 10
1.3 博弈的策略式表述 14
1.3.1 正式规定 14
1.3.2 例子 16
1.4 博弈的混合扩展式 18
1.5 混合策略与行为策略 20
1.5.1 正式关系 20
1.5.2 完美回忆与策略等价 22
1.6 博弈的联合形式表述 25
小结 27
习题 28
第二章 策略式分析:理论 32
2.1 优势和重复优势 32
2.2 纳什均衡 37
2.2.1 正式化和讨论 37
2.2.2 例子 41
2.2.3 存在性:非正式的讨论 46
2.3 零和双边博弈 47
2.4 纳什均衡:正式的存在性结论 52
2.5 强均衡和抗联盟均衡 55
2.6 相关均衡 57
2.7 可理性化 63
小结 69
习题 70
第三章 策略式分析:应用 74
3.1 寡头(Ⅰ):静态模型 74
3.1.1 古诺模型 74
3.1.2 伯川德模型 80
3.2 机制设计(Ⅰ):公共品的有效分配 84
3.2.1 认购机制 86
3.2.2 一个有效的机制 87
3.3 机制设计(Ⅱ):纳什实施 91
3.3.1 正式化设计问题 92
3.3.2 部分特性 94
3.4 市场(Ⅰ):宏观协调失灵 100
小结 104
习题 105
第四章 纳什均衡的精炼:理论 110
4.1 导论 110
4.2 排除“不可信威胁”的精炼:例子 110
4.3 子博弈完美均衡 115
4.4 弱完美贝叶斯均衡 118
4.5 排除“站不住脚的信念”的精炼:例子 121
4.5.1 偏离被解释为错误 122
4.5.2 偏离被解释为其他理论 123
4.5.3 偏离被解释为信号 126
4.6 序贯均衡 128
4.7 完美均衡和适当均衡 132
4.8 策略式精炼 135
小结 143
习题 144
第五章 纳什均衡的精炼:应用 153
5.1 寡头(Ⅱ):序贯行动 153
5.1.1 斯塔克伯格模型 153
5.1.2 容量约束下的价格竞争 155
5.2 市场(Ⅱ):分散化的价格形成 160
5.2.1 双边策略议价 160
5.2.2 总体环境中的策略议价 167
5.3 寡头(Ⅲ):差异性产品 172
5.4 机制设计(Ⅲ):不可分物品的有效分配 177
小结 183
习题 184
第六章 不完全信息:理论 188
6.1 导论和例子 188
6.2 贝叶斯博弈 191
6.2.1 海萨尼正式化 192
6.2.2 例子 193
6.3 贝叶斯纳什均衡 196
6.3.1 正式化 196
6.3.2 例子 198
6.4 信号博弈 203
6.4.1 导论和例子 203
6.4.2 正式化 206
6.4.3 信号均衡 207
6.4.4 例子 209
6.5 混合策略,回访:一种纯化方法 216
6.6 正向归纳法 220
6.6.1 直观标准:动机 220
6.6.2 信号博弈的一个正式定义 222
小结 223
习题 225
第七章 不完全信息:应用 231
7.1 市场(Ⅲ):劳动力市场中的信号 231
7.2 市场(Ⅳ):保险市场和逆向选择 244
7.3 机制设计(Ⅳ):单边拍卖 253
7.3.1 一级价格拍卖 253
7.3.2 最优拍卖设计:显示原理 256
7.4 机制设计(Ⅴ):买方—卖方交易 265
7.4.1 双向拍卖 265
7.4.2 有效交易的不可能性 269
小结 272
习题 274
第八章 重复互动:理论 279
8.1 导论和例子 279
8.2 重复博弈:基本的理论框架 281
8.3 无名氏定理:纳什均衡 283
8.3.1 无穷期 284
8.3.2 有限期 289
8.4 声誉和“非理性”:非正式的讨论 291
8.5 无名氏定理:子博弈完美均衡 297
8.5.1 无穷期 297
8.5.2 有限期 303
8.6 声誉和“非理性”:正式的分析 308
8.6.1 公共时间期限 308
8.6.2 不同时间期限 311
小结 315
习题 317
第九章 重复互动:应用 321
9.1 寡头(Ⅳ):古诺模式下的跨期串谋 321
9.1.1 完美观察 321
9.1.2 不完美观察 326
9.2 寡头(Ⅴ):伯川德模式下的跨期串谋 331
9.2.1 完美观察 331
9.2.2 不完美观察 333
9.3 市场(Ⅴ):效率工资和失业 337
9.3.1 完美观察 340
9.3.2 不完美观察 343
小结 346
习题 348
第十章 演化和理性 351
10.1 导论 351
10.2 静态分析 352
10.2.1 理论框架 352
10.2.2 演化稳定策略 353
10.2.3 演化稳定策略和均衡 354
10.2.4 例子 357
10.3 基本动态分析 359
10.3.1 复制者动态 359
10.3.2 复制者动态和均衡 362
10.3.3 例子 365
10.4 社会环境中的演化 367
10.4.1 社会演化系统 368
10.4.2 支付单调性和理性 372
10.4.3 例子 377
10.5 合作的演化:一个例子 381
小结 387
习题 388
第十一章 学习博弈 392
11.1 导论 392
11.2 强化学习 393
11.2.1 正的强化与固定的渴望 393
11.2.2 一般强化与可变的渴望 400
11.3 静态感知和短视行为 406
11.3.1 策略框架 407
11.3.2 通过模仿学习 408
11.3.3 更优—反应与最优—反应调整 409
11.4 记忆、期望与远见 414
11.4.1 虚拟行动 414
11.4.2 平滑虚拟行动 420
11.4.3 理性学习 426
小结 434
习题 435
第十二章 社会学习与均衡选择 439
12.1 导论 439
12.2 演化博弈:理论框架 440
12.2.1 策略计划 440
12.2.2 学习动态 440
12.3 演化博弈:不同的设定 441
12.3.1 双边协调博弈 442
12.3.2 最小努力博弈 444
12.3.3 古诺寡头 444
12.4 随机稳定与均衡选择 445
12.4.1 在全局互动下的双边博弈 447
12.4.2 在局部互动下的双边协调博弈 454
12.4.3 在中心化互动下的双边协调博弈 455
12.4.4 最小努力博弈 458
12.4.5 古诺寡头 459
12.5 实验根据 461
12.5.1 最小努力博弈 462
12.5.2 古诺寡头 463
12.6 扰动马尔可夫过程:基本概念和技巧 465
12.6.1 马尔可夫链 465
12.6.2 一个规范模型 467
12.6.3 随机稳定与长期动态 468
12.6.4 随机稳定:数学技术 470
12.7 可变渴望的强化学习 473
12.7.1 囚徒困境 475
12.7.2 纯协调博弈 480
12.7.3 实验证据:囚徒困境 481
小结 484
习题 485
参考文献 490
索引 501