当前位置:首页 > 工业技术
迭代自适应动态规划理论及应用
迭代自适应动态规划理论及应用

迭代自适应动态规划理论及应用PDF电子书下载

工业技术

  • 电子书积分:8 积分如何计算积分?
  • 作 者:魏庆来,宋睿卓,孙秋野著
  • 出 版 社:北京:科学出版社
  • 出版年份:2015
  • ISBN:9787030428691
  • 页数:146 页
图书介绍:非线性系统的最优控制一直是控制领域研究的热点和难点之一。由于近似动态规划在求解非线性系统最优控制时成功避免了维数灾”问题而获得广泛的关注。本书稿基于近似动态规划理论与算法,分别对多目标优化系统、跟踪系统、二人零和微分对策以及时滞系统的最优控制进行了深入的研究。提出一种新型无模型增量Q—学习方法,解决了在无模型条件下的多目标最优控制问题;应用贪婪启发式动态规划(HDP)迭代算法解决了非线性系统的最优跟踪控制问题;提出了一种新型迭代近似动态规划算法,解决了连续时间非线性系统二人零和微分对策问题;研究带有时滞的离散时间仿射非线性系统的最优控制问题。
《迭代自适应动态规划理论及应用》目录

第1章 自适应动态规划原理 1

1.1 最优控制理论概述 1

1.2 动态规划基本理论 2

1.2.1 离散系统的动态规划 3

1.2.2 连续系统的动态规划 4

1.2.3 动态规划的挑战 6

1.3 自适应动态规划的基本理论 6

1.3.1 自适应动态规划的原理 7

1.3.2 自适应动态规划的分类 8

1.3.2.1 启发式动态规划 9

1.3.2.2 二次启发式规划 10

1.3.2.3 执行依赖启发式动态规划 11

1.3.2.4 执行依赖二次启发式规划 12

1.3.3 无限时间与有限时间自适应动态规划 12

1.3.4 自适应动态规划的发展现状 13

参考文献 14

第2章 带有广义性能指标函数的非线性系统无模型多目标自适应动态规划 20

2.1 引言 20

2.2 多目标最优控制的基础 21

2.3 多目标自适应动态规划方法 22

2.4 无模型增量Q学习方法 32

2.4.1 增量Q学习方法的推导 32

2.4.2 增量Q学习神经网络实现 35

2.4.2.1 评判网络 35

2.4.2.2 执行网络 36

2.4.2.3 无模型增量Q学习算法过程 37

2.5 收敛性分析 37

2.6 仿真研究 40

参考文献 43

第3章 基于ESNs结构的非线性系统迭代DHP算法 46

3.1 引言 46

3.2 迭代DHP算法 47

3.2.1 迭代DHP算法的基本结构 47

3.2.2 迭代DHP算法的收敛性分析 49

3.3 基于ESNs实现迭代DHP算法 53

3.3.1 ESNs的基本构造 53

3.3.2 ESNs的训练过程 55

3.3.3 迭代DHP算法的实现 55

3.4 仿真研究 56

参考文献 60

第4章 无限时间非线性系统最优跟踪控制 62

4.1 引言 62

4.2 问题描述 63

4.3 基于贪婪HDP迭代算法的最优跟踪控制 64

4.3.1 系统变换 64

4.3.2 贪婪HDP迭代算法的推导 66

4.3.3 算法的过程 72

4.4 最优跟踪控制的神经网络实现 73

4.4.1 模型网络 74

4.4.2 评判网络 74

4.4.3 执行网络 75

4.5 仿真研究 76

参考文献 84

第5章 时滞非线性系统最优跟踪控制 86

5.1 引言 86

5.2 问题描述 87

5.3 迭代HDP算法及其收敛性 88

5.3.1 迭代HDP算法的推导 89

5.3.2 迭代HDP算法的收敛性分析 92

5.3.3 迭代HDP算法的设计步骤 97

5.4 迭代HDP算法的神经网络实现 98

5.4.1 评判网络 99

5.4.2 执行网络 99

5.5 仿真研究 100

参考文献 107

第6章 带有饱和执行器的时滞非线性系统最优控制 109

6.1 引言 109

6.2 问题描述 110

6.3 基于迭代ADP算法的最优控制 111

6.3.1 迭代ADP算法的推导 111

6.3.2 迭代ADP算法收敛性分析 112

6.4 迭代ADP算法实现 116

6.4.1 评判网络 117

6.4.2 执行网络 118

6.5 仿真研究 119

参考文献 122

第7章 有限时间仿射时滞非线性系统最优控制 124

7.1 引言 124

7.2 问题描述 124

7.3 仿射时滞非线性系统的有限时间最优迭代算法 126

7.3.1 算法的收敛性分析 127

7.3.2 迭代算法的实现步骤 132

7.4 迭代ADP算法实现 132

7.4.1 评判网络 132

7.4.2 执行网络 133

7.5 仿真研究 133

参考文献 135

第8章 有限时间非仿射时滞非线性系统最优控制 136

8.1 引言 136

8.2 问题描述 136

8.3 迭代ADP算法及其收敛性分析 138

8.3.1 迭代ADP算法的推导 138

8.3.2 算法的收敛性分析 140

8.4 仿真研究 144

参考文献 147

相关图书
作者其它书籍
返回顶部