专题1 智能体动机学习&史忠植,马刚,李建清 1
1概述 1
2动机理论 2
3动机学习 6
4基于动机的强化学习 9
5小结 15
参考文献 15
专题2 多智能体强化学习中的博弈、均衡和知识迁移&胡裕靖,高阳 17
1绪论 17
2背景知识 20
3不共享值函数的多智能体强化学习 24
4基于均衡迁移的多智能体强化学习 31
5稀疏交互的多智能体系统中的知识迁移和博弈约简 37
6小结 44
参考文献 45
专题3 一种基于中介agent的强化学习优化协商方法&陈利红,董红斌 48
1引言 48
2基于强化学习的双边多议题优化协商模型 49
3基于中介agent自适应学习的协调协商 53
4实验设计与分析 55
5小结 64
参考文献 64
专题4 多智能体协调技术综述&郝建业 66
1引言 66
2固定对手重复博弈 68
3合作式群体博弈 72
4非合作式群体博弈 74
5小结 77
参考文献 77
专题5 基于决策理论的多智能体规划&吴锋 81
1引言 81
2分布式局部可观察马尔可夫决策过程(DEC-POMDP) 83
3 DEC-POMDP的离线规划算法 85
4 DEC-POMDP的在线规划算法 90
5小结 92
参考文献 93
专题6 部分可观察环境中的序贯决策理论及方法研究&章宗长9 94
1引言 94
2部分可观察马尔可夫决策过程 95
3离线规划方法 99
4在线规划方法 104
5基于覆盖数的规划理论 107
6小结 108
参考文献 109
专题7 基于Landmark的启发式搜索规划&张雷,吴骏,王崇骏 112
1引言 112
2 STRIPS规划问题 112
3 STRIPS问题的启发式函数设计 114
4多值Landmark规划 118
5小结 127
参考文献 127
专题8 AutoRobot:基于多主体系统的自主机器人软件框架&毛新军,杨硕,杨森 129
1引言 129
2自主机器人及其软件特点 131
3机器人软件技术分析 135
4基于多主体系统的自主机器人软件体系结构 139
5自主机器人软件框架AutoRobot 144
6案例分析 147
7小结 151
参考文献 151
专题9 计算经济学与最优机制设计问题&唐平中 154
1计算经济学简介 154
2最优机制设计问题:单件商品 155
3最优机制设计:多件商品 159
4小结 160
参考文献 160
专题10 基于计算博弈论的出租车服务定价研究&甘家瑞,安波 162
1研究背景与相关工作 162
2博弈建模 164
3模型求解——紧凑表达法 169
4 ASM算法——基于元时间表的紧凑表达 169
5解决任意约束下的问题 179
6实验 183
7小结 187
参考文献 189
专题11 云计算中定价机制的研究&秦涛 191
1云计算简介 191
2云计算中的定价模型 193
3市场竞争、演变与定价策略优化 196
4小结 205
参考文献 206