预篇 变分原理与最优控制 3
第1章 变分原理 3
1.1 泛函极值问题实例 3
1.2 泛函的极值 6
1.2.1 极值的定义 6
1.2.2 极值曲线与绝对极值 8
1.3 泛函的变分 10
1.3.1 变分的定义和性质 10
1.3.2 泛函极值的必要条件 14
1.4 无约束变分问题 15
1.4.1 必要条件 15
1.4.2 横截条件 18
1.4.3 充分条件 19
1.4.4 含多个函数的泛函变分问题 20
1.5 约束变分问题 21
1.5.1 ?(x,y1…,yn)=0型约束 21
1.5.2 ?(x,y1,…,yn, y1…,yn)=0型约束 22
第2章 最优控制问题及实例 24
2.1 动态系统与状态空间简介 24
2.1.1 动态系统的数学描述 24
2.1.2 动态系统的状态空间 25
2.1.3 动态系统的几种形式 27
2.2 最优控制概述 27
2.3 最优控制实例分析 30
2.3.1 空间技术的问题 30
2.3.2 工程问题 32
2.3.3 生产问题 33
2.3.4 运动学问题 34
第3章 最优控制问题的数学描述 35
3.1 最优控制问题的初等描述 35
3.1.1 受控制系统的数学模型 35
3.1.2 约束条件 36
3.1.3 性能指标 36
3.1.4 最优控制的提法 37
3.2 精确数学表达形式 38
3.3 离散系统最优控制描述 39
3.3.1 离散系统的控制问题 39
3.3.2 连续控制问题离散化 40
第1篇 最优控制问题的变分方法 43
第4章 最优控制与变分问题的相互转换 43
4.1 最优控制问题的三种形式 43
4.1.1 Lagrange问题(积分型性能指标) 43
4.1.2 Mayer问题(终端指标) 43
4.1.3 Bolza问题(综合指标) 43
4.2 三种形式的等价关系 44
4.2.1 Bolza问题转化为Lagrange问题 44
4.2.2 Bolza问题转化为Mayer问题 44
4.2.3 Lagrange问题转化为Mayer问题 45
4.3 变分问题的三种形式及其等价关系 45
4.3.1 变分问题的三种形式 45
4.3.2 三种形式的等价关系 46
4.4 最优控制问题化为变分问题 46
4.5 变分问题化为最优控制问题 48
第5章 无约束最优控制问题的变分方法 49
5.1 数学模型与终端状态 49
5.2 固定终端时间极值的必要条件 51
5.2.1 x(tf)自由的情形 51
5.2.2 x(tf)受约束的情形 54
5.3 自由终端时间极值的必要条件 58
5.3.1 S=Rn的情形 59
5.3.2 S={x(tf) | N(x(tf),tf)=0,N为q维向量函数}的情形 60
5.4 一般结论及例子 64
第6章 约束最优控制问题的变分方法 69
6.1 问题提出 69
6.2 等式约束下的变分方法 70
6.3 特殊等式约束下的迭代方法 72
6.4 不等式约束下的变分方法 74
6.4.1 Pontryagin极小值原理 74
6.4.2 一般方法及例子 76
6.4.3 问题与思考 79
第2篇 动态规划方法 83
第7章 离散系统的动态规划方法 83
7.1 多阶段决策问题(引例及相关基本概念) 83
7.2 多阶段决策问题的数学描述 86
7.2.1 数学模型 86
7.2.2 Bellman最优性原理 86
7.2.3 动态规划基本定理 87
7.3 求解多阶段决策问题的动态规划方法 88
第8章 连续系统的动态规划方法 93
8.1 连续系统的最优性原理 93
8.2 最优控制的必要条件 94
8.3 动态规划计算方法 97
8.4 算例 98
8.5 其他终端时刻、终端状态的情形 101
8.6 两种系统(离散与连续)动态规划的比较 102
8.6.1 最优性原理 102
8.6.2 最优值函数 103
8.6.3 基本方程(最优值函数所满足的方程) 104
8.7 无约束变分方法、约束变分方法与连续动态规划方法比较 104
第3篇 最优控制问题的数值方法 109
第9章 两点边值问题 109
9.1 引言 109
9.2 线性边值问题 110
9.2.1 基本恒等式与共轭函数法 111
9.2.2 补足函数法 114
9.3 非线性边值问题 116
9.3.1 迭代-共轭函数法 116
9.3.2 拟线性方法(Newton法与补足函数法联合使用) 119
9.3.3 优化方法 121
9.3.4 Newton法 122
9.4 隐式边界条件的求解 124
9.5 多重打靶方法 126
第10章 无约束最优控制问题的数值方法 129
10.1 无约束变分方法的迭代算法 129
10.2 梯度法 130
10.2.1 泛函的梯度 130
10.2.2 迭代步长因子α的选择 132
10.2.3 梯度算法 132
10.3 共轭梯度法 137
10.4 Newton法(二阶变分法) 138
10.5 变尺度方法 139
第11章 约束最优控制问题的数值方法 141
11.1 控制变量约束的处理 141
11.2 约束梯度算法 142
11.3 Frank-Wolfe方法 143
11.4 罚函数法 144
11.5 另外形式的迭代算法 145
第4篇LQR问题专题研究 151
第12章 标准LQR问题 151
12.1 有限时间的LQR问题(连续系统的状态调节器) 151
12.1.1 数学模型 151
12.1.2 用最优性条件解反馈形式u (t)=u(x,t) 151
12.1.3 求解有限时间LQR问题(线性二次型最优控制问题)的步骤 155
12.1.4 关于Riccati矩阵的一些性质 159
12.2 有限时间的LQR问题(离散系统的状态调节器) 161
12.2.1 离散系统的数学模型 161
12.2.2 由极小值原理求最优反馈律 162
12.2.3 有限时间离散系统LQR问题解题步骤 162
12.2.4 定常系统的动态规划解法 163
12.3 无限时间的状态调节器 170
12.3.1 数学模型 170
12.3.2 最优反馈律 171
12.4 无限时间的定常状态调节器 172
12.4.1 数学模型 172
12.4.2 Riccati矩阵K(t,0,∞)的定常性质 173
12.5 附录 175
12.5.1 线性时变系统的解 176
12.5.2 线性定常系统的解 177
12.5.3 线性系统的可控性 178
12.5.4 线性系统的可观性 179
第13章 可转化为状态调节器的LQR问题 182
13.1 输出调节器 182
13.1.1 有限时间的输出调节器 182
13.1.2 无限时间的输出调节器(定常系统) 183
13.2 具有指定稳定度α的调节器 184
13.3 常值干扰下的调节器 186
13.3.1 不考虑输出方程的数学模型 186
13.3.2 最优反馈律 187
13.3.3 考虑输出方程的数学模型 189
13.4 跟踪调节器 193
13.4.1 不考虑输出y(t)的光滑要求 193
13.4.2 考虑对y(t)的光滑要求 194
第14章 次优LQR问题 198
14.1 问题的提出(次优反馈律) 198
14.2 关于代价矩阵VL(t)及其性质 199
14.3 次优控制的数学模型(次优LQR问题) 201
14.3.1 L(t)的结构问题 201
14.3.2 L(t)的最优选择 202
14.4 次优增益矩阵的收敛性和误差估计 203
14.5 次优LQR问题的最优性条件(必要条件) 206
14.6 分段定常增益矩阵的算法设计 210
第15章 无限终端次优调节器的研究 213
15.1 无限终端定常状态调节器的次优输出反馈律 213
15.2 无限终端定常输出调节器的最优输出反馈律 216
15.3 带控制结构约束的无线终端定常调节器 217
15.3.1 次优模型的建立 218
15.3.2 次优反馈的必要条件 218
15.4 算法设计 220
第5篇 最优控制的应用模型 225
第16章 最优管理问题 225
16.1 生产与库存问题 225
16.1.1 离散时间系统的最优库存模型 225
16.1.2 类似于离散时间的最优库存模型,关于连续时间系统的最优库存模型 233
16.2 最优消费时的最优积累率 235
16.3 最优经济增长模型 238
16.3.1 最优资本积累模型 238
16.3.2 引入人口平均消费量的模型 239
16.4 最优投资模型 242
第17章 最短时间和最少燃料的最优控制 246
17.1 Bang-Bang控制 246
17.2 非线性系统的时间最优控制 258
17.3 线性定常系统非奇异的判别条件 260
17.4 最小燃料问题 263
17.4.1 燃料最优控制 263
17.4.2 时间-燃料综合最优控制 266
第18章 最优控制应用实际案例——第二代YBCO高温超导带材磁悬浮系统的稳定控制 270
18.1 问题的提出 270
18.2 建模分析 271
18.3 模型的建立 274
18.4 模型的求解 275
18.4.1 静态外磁场下优化模型的求解 275
18.4.2 动态外磁场下最优控制模型的求解 279
参考文献 280