《多智能体系统及应用 卷2》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:王崇骏,史忠植,常亮,王文剑著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2018
  • ISBN:9787302487774
  • 页数:207 页
图书介绍:

专题1 智能体动机学习&史忠植,马刚,李建清 1

1概述 1

2动机理论 2

3动机学习 6

4基于动机的强化学习 9

5小结 15

参考文献 15

专题2 多智能体强化学习中的博弈、均衡和知识迁移&胡裕靖,高阳 17

1绪论 17

2背景知识 20

3不共享值函数的多智能体强化学习 24

4基于均衡迁移的多智能体强化学习 31

5稀疏交互的多智能体系统中的知识迁移和博弈约简 37

6小结 44

参考文献 45

专题3 一种基于中介agent的强化学习优化协商方法&陈利红,董红斌 48

1引言 48

2基于强化学习的双边多议题优化协商模型 49

3基于中介agent自适应学习的协调协商 53

4实验设计与分析 55

5小结 64

参考文献 64

专题4 多智能体协调技术综述&郝建业 66

1引言 66

2固定对手重复博弈 68

3合作式群体博弈 72

4非合作式群体博弈 74

5小结 77

参考文献 77

专题5 基于决策理论的多智能体规划&吴锋 81

1引言 81

2分布式局部可观察马尔可夫决策过程(DEC-POMDP) 83

3 DEC-POMDP的离线规划算法 85

4 DEC-POMDP的在线规划算法 90

5小结 92

参考文献 93

专题6 部分可观察环境中的序贯决策理论及方法研究&章宗长9 94

1引言 94

2部分可观察马尔可夫决策过程 95

3离线规划方法 99

4在线规划方法 104

5基于覆盖数的规划理论 107

6小结 108

参考文献 109

专题7 基于Landmark的启发式搜索规划&张雷,吴骏,王崇骏 112

1引言 112

2 STRIPS规划问题 112

3 STRIPS问题的启发式函数设计 114

4多值Landmark规划 118

5小结 127

参考文献 127

专题8 AutoRobot:基于多主体系统的自主机器人软件框架&毛新军,杨硕,杨森 129

1引言 129

2自主机器人及其软件特点 131

3机器人软件技术分析 135

4基于多主体系统的自主机器人软件体系结构 139

5自主机器人软件框架AutoRobot 144

6案例分析 147

7小结 151

参考文献 151

专题9 计算经济学与最优机制设计问题&唐平中 154

1计算经济学简介 154

2最优机制设计问题:单件商品 155

3最优机制设计:多件商品 159

4小结 160

参考文献 160

专题10 基于计算博弈论的出租车服务定价研究&甘家瑞,安波 162

1研究背景与相关工作 162

2博弈建模 164

3模型求解——紧凑表达法 169

4 ASM算法——基于元时间表的紧凑表达 169

5解决任意约束下的问题 179

6实验 183

7小结 187

参考文献 189

专题11 云计算中定价机制的研究&秦涛 191

1云计算简介 191

2云计算中的定价模型 193

3市场竞争、演变与定价策略优化 196

4小结 205

参考文献 206