第1章 博弈论简介 1
1.1 什么是博弈 2
1.1.1 博弈的表示形式 2
1.1.2 纯策略和混合策略 5
1.2 博弈解的概念 6
1.2.1 理性与公共知识 6
1.2.2 占优策略均衡 7
1.2.3 纳什均衡 8
1.3 博弈学习动力学简介 10
1.3.1 博弈学习框架 10
1.3.2 最优响应动力学 12
1.3.3 择优响应动力学 12
1.4 本章要点小结 14
参考文献 14
第2章 演化博弈动力学 17
2.1 群体博弈 18
2.1.1 有限群体博弈 18
2.1.2 无限群体博弈 19
2.1.3 纳什均衡与演化稳定策略 20
2.2 随机演化动力学 22
2.2.1 适应度景观 23
2.2.2 典型的更新规则 24
2.2.3 固定概率、平稳分布与策略选择 26
2.3 连续演化动力学 28
2.3.1 调整协议及平均动力学 29
2.3.2 几类典型的演化动力学 29
2.3.3 平衡点、稳定性与纳什均衡 31
2.4 本章要点小结 33
参考文献 33
第3章 网络博弈 35
3.1 博弈结构、图与复杂网络 36
3.1.1 图的基本概念 36
3.1.2 典型的图和复杂网络模型 37
3.2 网络博弈模型 40
3.2.1 网络博弈的定义 40
3.2.2 对交互网络博弈 42
3.2.3 群组交互网络博弈 45
3.3 网络诱导的纳什均衡 47
3.3.1 网络诱导的纳什均衡定义 47
3.3.2 网络诱导的纳什均衡存在性 49
3.4 本章要点小结 52
参考文献 52
第4章 网络上的随机漂移过程 55
4.1 网络上的演化动力学模型 56
4.1.1 网络状态集及其适应度景观 56
4.1.2 状态更新规则 56
4.1.3 演化过程的数学描述 58
4.1.4 应用例子 60
4.2 网络上的随机漂移 62
4.2.1 Wright-Fisher过程 62
4.2.2 生灭过程 65
4.2.3 死生过程 69
4.2.4 选边过程 71
4.2.5 入侵关键节点 72
4.3 动态网络上的随机漂移 76
4.3.1 动态网络上的随机漂移模型 76
4.3.2 动态网络上中性策略的固定概率 79
4.4 本章要点小结 82
参考文献 83
第5章 网络上的常数选择过程 87
5.1 网络上常数选择过程的数学模型 88
5.2 网络上常数选择的一般性质 91
5.2.1 等价随机过程与相关数学概念 92
5.2.2 局部性质与全局性质 93
5.2.3 示例:死生过程 100
5.3 网络结构对于常数选择的放缩作用 106
5.3.1 网络结构对于选择的调节作用 106
5.3.2 节点温度与网络的热异质度 108
5.3.3 选择调节器的结构特征 111
5.3.4 构造选择调节器 119
5.4 本章要点小结 122
参考文献 123
第6章 网络上的演化博弈动力学 127
6.1 网络上的演化博弈动力学模型 128
6.1.1 网络演化博弈动力学的框架 128
6.1.2 策略选择 129
6.2 两策略群组交互博弈中的策略选择 130
6.2.1 两策略群组交互博弈模型 130
6.2.2 完全图 131
6.2.3 环状图 133
6.2.4 星状图 136
6.2.5 示例 139
6.2.6 一般两策略群组交互网络博弈中的策略选择 140
6.3 两策略对交互网络博弈中的策略选择 142
6.4 多策略对交互博弈中的策略选择 146
6.5 本章要点小结 148
参考文献 148
第7章 复杂网络上的合作涌现机制 151
7.1 合作困境及其博弈模型 152
7.1.1 合作困境的几类博弈模型 152
7.1.2 合作涌现机制 155
7.2 静态网络上的合作涌现 155
7.2.1 空间格子网络的合作团簇 156
7.2.2 一般网络上合作涌现的条件 157
7.3 共演化网络中合作的涌现 160
7.3.1 基于邻域继承机制的共演化模型 160
7.3.2 基于邻域继承机制的合作行为涌现现象 162
7.3.3 不同情境下的合作行为的涌现 163
7.3.4 合作的涌现机制分析 166
7.4 合作涌现机制的实证研究 169
7.5 本章要点小结 171
参考文献 172
第8章 符号网络上的演化博弈 177
8.1 符号网络及其结构冲突 178
8.1.1 符号网络的概念 178
8.1.2 结构平衡 178
8.1.3 结构冲突 179
8.2 符号网络上的联盟博弈及其动力学模型 181
8.2.1 符号网络上的联盟博弈及其动力学 181
8.2.2 演化动力学的参数选择 183
8.2.3 基于网络博弈动力学求解符号网络中结构冲突数目的算法 186
8.3 不同符号网络中的结构冲突优化 188
8.3.1 无向无权符号网络 188
8.3.2 无向加权符号网络 191
8.3.3 有向符号网络 193
8.4 本章要点小结 194
参考文献 195
第9章 行为网络上的演化博弈动力学 199
9.1 引言 200
9.2 行为网络上的演化动力学模型 201
9.2.1 行为网络的基本概念 201
9.2.2 复制-突变动力学 203
9.2.3 选择-漂移动力学的构造 205
9.2.4 突变网络 207
9.3 行为聚集和行为雪崩的涌现 208
9.3.1 从聚集到雪崩 209
9.3.2 动力学分岔 212
9.4 最优行为的涌现 214
9.4.1 适应度景观的相变 215
9.4.2 时变选择-突变机制 218
9.5 非对称性导致的行为振荡 221
9.6 本章要点小结 223
参考文献 224
第10章 连续势博弈中的学习动力学及其在分布式协同控制中的应用 227
10.1 引言 228
10.2 连续势博弈及其学习动力学的基本概念 229
10.2.1 连续势博弈 229
10.2.2 重复博弈及其学习动力学 231
10.3 梯度学习 233
10.4 基于收益信息的博弈学习动力学 235
10.4.1 试探性移动 235
10.4.2 学习算法 237
10.4.3 收敛性分析 239
10.4.4 程序终止准则 242
10.5 基于博弈学习的多个体同步算法 244
10.5.1 多个体同步的连续势博弈模型 244
10.5.2 基于位置信息的同步协议 245
10.5.3 基于距离信息的同步协议 246
10.6 本章要点小结 250
参考文献 250
索引 253