第1篇 最优控制与变分方法 2
第1章 变分法简介 2
1.1 泛函极值问题实例 2
1.2 泛函的极值 5
1.2.1 极值的定义 5
1.2.2 极值曲线与绝对极值 6
1.3 泛函的变分 8
1.3.1 变分的定义和性质 8
1.3.2 泛函极值的必要条件 12
1.4 无约束变分问题 13
1.4.1 必要条件 13
1.4.2 横截条件 15
1.4.3 充分条件 16
1.4.4 含多个函数的泛函变分问题 17
1.5 约束变分问题 18
1.5.1 ?(x,y1,…,yn)=0型约束 18
1.5.2 ?(x,y1,…,yn,y?,…,y?)=0型约束 18
第2章 最优控制问题及实例 20
2.1 动态系统与状态空间简介 20
2.1.1 动态系统的数学描述 20
2.1.2 动态系统的状态空间 21
2.1.3 动态系统的几种形式 22
2.2 最优控制概述 23
2.3 最优控制实例分析 26
2.3.1 空间技术中的问题 26
2.3.2 工程问题 27
2.3.3 生产问题 28
2.3.4 运动学问题 29
第3章 最优控制问题的数学描述 30
3.1 最优控制问题的初等描述 30
3.1.1 受控制系统的数学模型 30
3.1.2 约束条件 31
3.1.3 性能指标 31
3.1.4 最优控制的提法 32
3.2 精确数学表达形式 32
3.3 最优控制的三种等价形式 33
3.3.1 lagrange(拉格朗日)问题(积分型能指标) 33
3.3.2 Mayer(梅厄)问题(终端指标) 34
3.3.3 Bolza(波尔查)问题(综合指标) 34
3.4 三类问题的互化 34
3.4.1 Bolza问题转化为Lagrange问题 34
3.4.2 Bolza问题转化为Mayer问题 35
3.4.3 Legrange问题转化为Mayer问题 35
3.5 最优控制问题与变分问题的互化 35
3.5.1 变分问题的三种等价形式 35
3.5.2 三种变分问题的互化 36
3.5.3 最优控制问题化为变分问题 36
3.5.4 变分问题化为最优控制问题 37
3.6 离散系统最优控制描述 38
3.6.1 离散系统的控制问题 38
3.6.2 连续控制问题离散化 39
第4章 无约束最优控制问题的变分方法 40
4.1 数学模型与终端状态 40
4.2 固定终端时间极值的必要条件 42
4.2.1 x(tf)自由的情形 42
4.2.2 x(tf)受约束的情形 44
4.3 自由终端时间极值的必要条件 46
4.3.1 S=Rn的情形 46
4.3.2 S={x(tf)|N(x(tf),tf)=0,N为q维向量函数}的情形 48
4.4 一般结论及例子 51
第5章 约束最优控制问题的变分方法 56
5.1 问题提出 56
5.2 等式约束下的变分方法 57
5.3 特殊等式约束下的迭代方法 59
5.4 不等式约束下的变分方法 60
5.4.1 Pontryagin极小值原理 61
5.4.2 一般方法及例子 63
5.4.3 问题与思考 67
第2篇 动态规划方法 70
第6章 离散系统的动态规划方法 70
6.1 多阶段决策问题(引例及相关基本概念) 70
6.2 多阶段决策问题的数学描述 73
6.2.1 数学模型 73
6.2.2 Bellman最优性原理 73
6.2.3 动态规划基本定理 74
6.3 求解多阶段决策问题的动态规划方法 75
第7章 连续系统的动态规划方法 79
7.1 连续系统的最优性原理 79
7.2 最优控制的必要条件 80
7.3 动态规划计算方法 83
7.4 算例 84
7.5 其他终端时刻、终端状态的情形 86
7.6 两种系统(离散与连续)动态规划的比较 87
7.6.1 最优性原理 87
7.6.2 最优值函数 88
7.6.3 基本方程(最优值函数所满足的方程) 88
7.7 无约束变分方法、约束变分方法与连续动态规划方法比较 89
第8章 最优控制的应用模型 91
8.1 生产与库存问题 91
8.1.1 离散时间系统的最优库存模型 91
8.1.2 连续时间系统的最优库存模型 94
8.1.3 带有贴现率的库存问题 95
8.2 最优消费时的最优积累率 96
8.3 最优经济增长模型 99
8.3.1 最优资金积累模型 99
8.3.2 引入人口平均消费量的模型 100
8.4 最优投资模型 102
第3篇 最优控制问题的数值方法 108
第9章 两点边值问题 108
9.1 引言 108
9.2 线性边值问题 109
9.2.1 基本恒等式与共轭函数法 109
9.2.2 补足函数法 112
9.3 非线性边值问题 114
9.3.1 迭代-共轭函数法 114
9.3.2 拟线性方法(Newton法与补足函数法联合使用) 117
9.3.3 优化方法 119
9.3.4 Newton法 120
9.4 隐式边界条件的求解 122
9.5 多重打靶方法 124
第10章 无约束最优控制问题的数值方法 126
10.1 无约束变分方法的迭代算法 126
10.2 梯度法 127
10.2.1 泛函的梯度 127
10.2.2 迭代步长因子α的选择 129
10.2.3 梯度算法 129
10.3 共轭梯度法 133
10.4 Newton法(二阶变分法) 135
10.5 变尺度方法 136
第11章 约束最优控制问题的数值方法 138
11.1 控制变量约束的处理 138
11.2 约束梯度算法 139
11.3 Frank-Wolfe方法 139
11.4 罚函数法 140
11.5 另外形式的迭代算法 142
第4篇 LQR问题专题研究 147
第12章 标准LQR问题 147
12.1 有限时间的LQR问题(连续系统)的状态调节器 147
12.1.1 数学模型 147
12.1.2 用最优性条件解反馈形式u*(t)=u(x,t) 147
12.1.3 求解有限时间LQR问题(线性二次型最优控制问题)的步骤 150
12.1.4 关于Riccait矩阵的一些性质 152
12.2 有限时间的LQR问题(离散系统的状态调节器) 154
12.2.1 离散系统的数学模型 154
12.2.2 由极小值原理求最优反馈律 154
12.2.3 有限时间离散系统LQR问题解题步骤 154
12.2.4 定常系统的动态规划解法 155
12.3 无限时间的状态调节器 160
12.3.1 数学模型 160
12.3.2 最优反馈律 160
12.4 无限时间的定常状态调节器 162
12.4.1 数学模型 162
12.4.2 Riccati矩阵K(t,0,∞)的定常性质 162
12.5 附录 164
12.5.1 线性时变系统的解 164
12.5.2 线性定常系统的解 165
12.5.3 线性系统的可控性 166
12.5.4 线性系统的可观性 167
第13章 可转化为状态调节器的LQR问题 171
13.1 输出调节器 171
13.1.1 有限时间的输出调节器 171
13.1.2 无限时间的输出调节器(定常系统) 172
13.2 具有指定稳定度α的调节器 173
13.3 常值干扰下的调节器 175
13.3.1 不考虑输出方程的数学模型 175
13.3.2 最优反馈律 176
13.3.3 考虑输出方程的数学模型 177
13.4 跟踪调节器 181
13.4.1 不考虑输出y(t)的光滑要求 181
13.4.2 考虑对y(t)的光滑要求 182
第14章 次优LQR问题 185
14.1 问题的提出(次优反馈律) 185
14.2 关于代价矩阵VL(t)及其性质 186
14.3 次优控制的数学模型(次优LQR问题) 188
14.3.1 L(t)的结构问题 188
14.3.2 L(t)的最优选择 188
14.4 次优增益矩阵L°M(t)的收敛性和误差估计 189
14.5 次优LQR问题的最优性条件(必要条件) 192
14.6 分段定常增益矩阵的算法设计 195
第15章 无限终端次优调节器的研究 198
15.1 无限终端定常状态调节器的次优输出反馈律 198
15.2 无限终端定常输出调节器的最优输出反馈律 201
15.3 带控制结构约束的无限终端定常调节器 202
15.3.1 次优模型的建立 202
15.3.2 次优反馈的必要条件 203
15.3.3 算法设计 204
附录 补充例题详解 206
参考文献 224