目录 1
第1章 为什么需要多个机器人 1
1.1 多机器人的优点 1
1.2 经典问题 2
1.3 智能体与多智能体系统 2
1.4 多智能体机器人学 3
第2章 合作式机器人的控制 6
2.1 与合作有关的研究 6
2.1.1 分布式的人工智能 7
2.1.2 分布式系统 7
2.1.3 生物学 7
2.2 学习,进化与适应 8
2.3 多机器人控制的设计 9
第3章 主要的机器人技术 11
3.1 基于行为的机器人技术 11
3.2 集体机器人技术 12
3.3 进化机器人技术 13
3.4 来自生物学与社会学的启发 15
3.5 总结 16
第4章 计算模型与技术 17
4.1 强化学习 17
4.1.1 马尔可夫决策过程 18
4.1.2 强化学习算法 18
4.1.5 多智能体强化学习 19
4.1.3 时间差分技术 19
4.1.4 Q-学习 19
4.2 遗传算法 21
4.3 人工生命 22
4.4 人工免疫系统 23
4.5 概率建模 24
4.6 有关多机器人规划与协调的研究 25
第5章 多智能体机器人系统设计主要的研究课题 27
5.1 自组织 27
5.2 局部性能与全局性能 28
5.3 规划 28
5.5 协同进化 29
5.4 多机器人学习 29
5.6 隐现行为 30
5.7 反应式系统与推理式系统 30
5.8 异类系统与同类系统 31
5.9 模拟机器人与实体机器人 31
5.10 多智能体机器人系统的动力性 32
5.11 总结 33
第6章 多智能体强化学习中的技术 34
6.1 自治的群体机器人 34
6.1.1 概述 34
6.1.2 感知能力 35
6.1.3 远程传感器 35
6.1.4 短程传感器 36
6.1.5 激励提取 37
6.1.6 简单行为 39
6.1.7 运动机制 40
6.2 多智能体强化学习 40
6.2.1 强化学习的原理 41
6.2.2 行为选择机制 43
6.3 多智能体强化学习工具箱 43
6.3.1 体系结构 43
6.3.2 文件组织 45
6.3.3 函数说明 45
6.3.5 数据结构 47
6.3.4 用户设置 47
6.4 总结 48
第7章 多智能体强化学习中的结果分析 50
7.1 测量 50
7.1.1 激励频率 50
7.1.2 行为选择频率 52
7.2 群体行为 52
7.2.1 集体包围 52
7.2.2 RANGER机器人间的合作 56
7.2.3 不同机器人群的并发学习 61
第8章 多智能体强化学习中的要素 71
8.1 集体感知 71
8.2 初始空间分布 79
8.4 行为选择机制 83
8.3 反S型函数 83
8.5 运动机制 87
8.6 隐现的周期性运动 89
8.7 宏观稳定而微观不稳定的属性 90
8.8 主导行为 91
第9章 进化的多智能体强化学习 93
9.1 机器人群示例 93
9.1.3 行为学习机制 95
9.2 进化群体运动策略 95
9.1.2 目标的运动特征 95
9.1.1 目标的空间分布 95
9.2.1 染色体表示 96
9.2.2 适应度函数 96
9.2.3 算法 98
9.2.4 遗传算法中的参数 98
9.3 例子 99
9.4 进化的多智能体强化学习工具箱 103
9.4.1 文件组织 103
9.4.2 函数说明 103
9.4.3 用户设置 104
9.5 总结 105
第10章 双智能体系统中的协同行为 106
10.1 研究重点 106
10.3 双智能体系统的特殊角色 107
10.2 双智能体的学习 107
10.4 机器人智能体的基本能力 108
10.5 建议提供智能体的基本原理 109
10.5.1 基本动作——学习的先决条件 109
10.5.2 一般性行为的遗传规划 109
10.5.3 特殊策略性行为的遗传规划 110
10.6 复杂行为的学习 111
10.6.1 实验设计 111
10.6.2 机器人环境的复杂性 111
10.6.4 平面姿态 112
10.6.3 实验结果 112
10.6.5 曲线姿态 115
10.6.6 角姿态 115
10.6.7 点姿态 115
10.7 总结 115
第11章 集体行为 117
11.1 群体行为 118
11.1.1 什么是群体行为 118
11.1.2 群体行为学习回顾 118
11.2 方法 119
11.2.1 基本思想 119
11.2.3 集体推箱的性能标准 120
11.2.4 集体推箱行为的进化 120
11.2.2 群体机器人 120
11.2.5 远程的进化计算智能体 121
11.3 应用排斥力的集体推箱 121
11.3.1 人工排斥力模型 122
11.3.2 推力与箱子的相应运动 122
11.3.3 染色体表示 122
11.3.4 适应度函数 123
11.3.5 例子 124
11.4 用外部接触力与力矩集体推箱 129
11.4.1 3个群体机器人与箱子之间的交互作用 129
11.4.2 推圆柱体箱子 129
11.4.3 推立方体箱子 130
11.4.5 适应度函数 131
11.4.4 染色体表示 131
11.4.6 例子 132
11.5 最优保留进化的收敛性分析 144
11.5.1 马尔可夫链的转移矩阵 144
11.5.2 用特征值描述转移矩阵特征 145
11.6 进化的集体行为实现工具箱 148
11.6.1 用人工排斥力集体推箱的工具箱 149
11.6.2 实现推圆柱体箱子或立方体箱子任务的工具箱 153
11.7 总结 158
第12章 多智能体的自组织 159
12.1 人工势能场 160
12.1.1 基于人工势能场的运动规划 160
12.2 自组织概述 161
12.1.2 集体势能场图的构建 161
12.3 势能场图的自组织 162
12.3.1 机器人的坐标系 162
12.3.2 接近度测量 163
12.3.3 邻域的距离联想 163
12.3.4 势能场图的递增式自组织 164
12.3.5 机器人的运动选择 165
12.4 实验12-1 166
12.4.1 实验设计 166
12.4.2 实验结果 167
12.5 实验12-2 172
12.5.1 实验设计 172
12.6 讨论 177
12.5.2 实验结果 177
12.7 多智能体自组织工具箱 179
12.7.1 体系结构 179
12.7.2 文件组织 179
12.7.3 函数说明 179
12.7.4 用户设置 182
12.7.5 数据结构 182
第13章 进化的多智能体自组织 183
13.1 合作式运动策略的进化 184
13.1.1 接近度激励的表示 185
13.1.2 激励-反应对 185
13.1.4 适应度函数 186
13.1.3 染色体表示 186
13.1.5 算法 187
13.2 实验13-1 189
13.2.1 实验设计 191
13.2.2 与非进化模式的比较 191
13.2.3 实验结果 192
13.3 讨论 196
13.3.1 群体行为的进化 196
13.3.2 机器人的合作 196
13.4 进化的多智能体自组织工具箱 199
13.4.1 体系结构 199
13.4.4 用户设置 201
13.4.3 函数说明 201
13.4.2 文件组织 201
13.4.5 数据结构 204
13.5 总结 207
第14章 多智能体机器人技术工具箱 208
14.1 概述 208
14.2 例子 208
14.2.1 真实图的计算 209
14.2.2 初始化 211
14.2.3 开始 212
14.2.4 结果显示 213
参考文献 215
索引 231