《有限理性下的演化博弈与合作机制研究》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:全吉著
  • 出 版 社:北京:经济管理出版社
  • 出版年份:2019
  • ISBN:9787509666579
  • 页数:187 页
图书介绍:本书以演化博弈论中的博弈学习机制和系统演化动态为研究对象,探讨个体策略演化与系统稳定均衡问题,由此寻求各类社会困境博弈中的合作演化机制。内容涉及到到演化博弈论、博弈学习理论、系统演化动力学、合作机制四个方面。书中系统总结和归纳了演化博弈中的各种学习机制,特别关注有限群体和有结构群体中系统的随机演化动态和群体合作演化问题。本书是作者对演化博弈论与合作演化机制问题长期深入思考的精炼,总结了作者在演化博弈论、博弈学习理论、演化博弈动力学等领域的大量研究成果,对采用演化博弈论方法解释现实中广泛存在的合作现象,以及采用动力学方法对复杂动态系统建模方面都具有一定的参考价值和借鉴意义。本书可作为演化博弈论、复杂系统动力学、博弈学习理论等研究领域科研人员的参考书,也可作为管理科学与工程、系统工程等专业的研究生参考用书。

第1章 绪论 1

1.1 经典博弈论的发展概述 1

1.1.1 经典博弈论的发展 1

1.1.2 经典博弈论的局限性 3

1.2 演化博弈论的基本思想及其均衡概念 4

1.2.1 有限理性与演化博弈论的提出 4

1.2.2 演化博弈论中的均衡概念 6

1.3 社会困境问题与合作的演化 7

1.4 本书的主要内容安排 8

第2章 演化博弈中的学习机制与演化动态 11

2.1 基于微分方程的演化动态 12

2.1.1 复制动态模型 12

2.1.2 最优反应动态模型 16

2.1.3 Logit动态模型 16

2.1.4 BNN动态模型 17

2.1.5 Smith动态模型 17

2.2 基于随机过程的演化动态 17

2.3 基于智能优化算法与神经网络的学习机制 18

2.4 其他几种博弈学习机制 20

2.4.1 强化学习 20

2.4.2 信念学习和贝叶斯学习 20

2.4.3 老练学习和经验加权吸引力学习 21

2.5 有结构种群中个体的几种学习机制 22

2.5.1 基于Fermi函数的模仿学习机制 22

2.5.2 “赢了保持输了改变”的学习机制 23

2.5.3 愿景驱动的学习机制 23

2.6 本章小结 23

第3章 有限群体中非均匀连接下的随机演化博弈模型 25

3.1 有限群体中非均匀连接下的演化模型 25

3.2 随机演化博弈模型中随机过程极限分布的解析性质 28

3.2.1 根据模型中的参数取值进行情况分类 28

3.2.2 噪声强度ε→0+时系统极限分布的解析结果 30

3.2.3 任意噪声强度下系统极限分布的解析性质 38

3.3 各类2×2对称博弈中系统的极限分布与稳定均衡状态 41

3.3.1 占优型博弈中系统的极限分布与数值算例 42

3.3.2 协调型博弈中系统的极限分布与数值算例 43

3.3.3 共存型博弈中系统的极限分布与数值算例 45

3.3.4 本节命题的证明 46

3.4 非均匀连接下的随机演化博弈模型仿真 48

3.4.1 “囚徒困境”博弈中系统的演化稳定状态仿真与结果分析 48

3.4.2 “协调博弈”中系统的演化稳定状态仿真与结果分析 53

3.4.3 “鹰鸽博弈”中系统的演化稳定状态仿真与结果分析 56

3.5 本章小结 60

第4章 基于Moran过程的演化博弈模型 61

4.1 引言 61

4.2 无变异和弱选择下基于扎根概率的模型解的解析特性 64

4.2.1 协调型博弈 70

4.2.2 共存型博弈 71

4.3 有变异的基于生灭过程极限分布的模型解的解析特性 72

4.4 有任意变异率的系统稳定均衡的数值算例与仿真 75

4.4.1 协调博弈的数值算例与仿真 75

4.4.2 鹰鸽博弈的数值算例与仿真 79

4.5 本章小结 82

第5章 基于Wright-Fisher过程的演化博弈模型 85

5.1 引言 85

5.2 无变异和弱选择下基于扎根概率的模型解的解析特性 87

5.2.1 问题描述 87

5.2.2 扎根概率计算 88

5.2.3 解析结果 91

5.3 有任意变异率的系统稳定均衡的数值算例与仿真 93

5.3.1 具有变异的系统演化模型 93

5.3.2 数值算例与仿真结果 94

5.4 本章小结 106

第6章 复杂网络上的连续“囚徒困境”博弈中群体合作行为及其影响因素 109

6.1 合作的进化与网络互惠机制 109

6.1.1 空间演化博弈 110

6.1.2 复杂网络上的社会困境博弈 111

6.1.3 博弈和网络的互演化机制与合作的涌现 116

6.2 复杂网络上的连续“囚徒困境”模型及个体的学习机制 118

6.3 记忆、模仿及不确定性对各种网络上群体合作的影响研究 121

6.3.1 最近邻耦合网络和NW小世界网络 121

6.3.2 BA无标度网络 128

6.4 度相关的内疚感对BA网络上的“囚徒困境”中群体合作的影响 133

6.5 基于PSO的空间公共物品博弈及群体合作行为 141

6.5.1 公共物品博弈中基于PSO的个体学习机制 141

6.5.2 基于PSO的学习机制对于群体合作涌现的有效性验证 143

6.5.3 组间规模报酬系数异质性对群体合作的影响 145

6.6 本章小结 149

第7章 总结与展望 151

7.1 本书主要内容总结 151

7.2 研究展望 153

参考文献 155