第一章 绪论 1
1.1 课题来源 1
1.2 课题研究的目的和意义 1
1.3 移动机器人国内外研究概况 2
1.4 论文的主要研究内容 5
第二章 增强学习研究 8
2.1 增强学习简介 8
2.2 最优搜索型强化学习算法 11
2.3 经验强化型增强学习算法 15
2.4 部分感知 16
2.5 函数估计 18
2.6 符号学习和增强学习偏差 20
2.7 增强学习应用 23
2.8 小结 24
第三章 ART2自适应谐振神经网络理论 25
3.1 自适应谐振理论ART 25
3.2 ART2神经网络模型 26
3.3 ART2神经网络的基本工作原理 27
3.4 ART2神经网络学习算法 29
3.5 小结 30
第四章 移动机器人路径规划方法研究 32
4.1 传统路径规划方法 33
4.2 智能路径规划方法 34
4.3 小结 38
第五章 连续任务增强学习方法S-learning及基于最先策略的增强学习方法FPRL 39
5.1 增强学习行为选择策略 39
5.2 渐进式Soft-Max行为选择策略 41
5.3 一种连续任务On-Policy增强学习方法S-Learning 42
5.4 基于最先策略的增强学习方法FPRL 46
5.5 小结 47
第六章 基于增强学习的ART2神经网络RL-ART2 48
6.1 基于增强学习的ART2神经网络RL-ART2 49
6.2 RL-ART2的学习算法 50
6.3 小结 52
第七章 基于RL-ART2神经网络的移动机器人多障碍物避碰撞系统RLART2-CAS 54
7.1 引言 54
7.2 基于规则的移动机器人避碰撞方法 55
7.3 基于RL-ART2的避碰撞系统RLART2-CAS 60
7.4 小结 63
第八章 仿真实验分析 64
8.1 仿真平台及环境设置 64
8.2 增强学习评价仿真实验 66
8.3 RL-ART2神经网络的避碰撞仿真实验 70
8.4 RL-ART2神经网络路径规划仿真实验 72
8.5 小结 76
第九章 总结与展望 77
9.1 总结 77
9.2 进一步工作 78
参考文献 79
致谢 88