第一章 问题的提法与数学模型 1
1.1 离散时间系统的最优控制问题 1
1.2 数学规划模型 3
1.3 连续时间系统的最优控制问题 6
1.4 泛函极值模型 10
第二章 数学规划基本理论 13
2.1 无约束极值及等式约束极值理论 13
2.2 库恩--塔克(Kuhn-Tucker)理论 15
2.3 拉格朗日对偶性与鞍点最优性 22
2.4 算法的基本性质 26
第三章 最大值原理基本理论 33
3.1 连续时间系统最大值原理的若干形式 33
3.2 最大值原理的证明 39
3.3 最大值原理的证明(泛函分析方法) 52
3.4 登月艇的软着陆推力控制问题 58
3.5 离散时间系统的最大值原理 62
第四章 动态规划基本理论 73
4.1 离散时间系统的动态规划理论 73
4.2 具有二次型指标函数的线性系统最优控制问题(离散时间系统) 80
4.3 连续时间系统的动态规划理论 84
4.4 最速控制与二次型指标线性系统最优控制问题(连续时间系统) 92
4.5 动态规划常规算法 97
4.6 动态规划与最大值原理的关系 102
第五章 离散时间系统最优控制问题的数值方法 108
5.1 无约束算法,最速下降法与牛顿法 108
5.2 无约束算法,共轭梯度法与拟牛顿法 118
5.3 有约束算法 126
5.4 离散时间系统动态规划的特殊算法 138
5.5 离散时间系统的微分动态规划 144
第六章 连续时间系统最优控制问题的数值方法 151
6.1 函数空间中梯度的求法 151
6.2 函数空间中的最速下降法与共轭梯度法 158
6.3 函数空间中的牛顿法 160
6.4 连续时间系统的微分动态规划 165
第七章 离散时间系统的随机最优控制 170
7.1 问题的提法 170
7.2 离散时间系统的随机动态规划 174
7.3 状态信息不完整的随机控制问题 177
7.4 次优控制技术 185
第八章 连续时间系统的随机最优控制 195
8.1 连续随机过程与随机微分方程 195
8.2 马尔可夫扩散过程 197
8.3 卡尔曼--布西滤波器 205
8.4 受控马尔可夫过程的动态规划理论 212
8.5 连续时间的线性二次随机最优控制 218
8.6 信息不完整的情况 226
第九章 最优控制中的神经网络技术 233
9.1 神经网络的基本概念和组成 233
9.2 神经网络模型 240
9.3 解凸二阶规划的神经网络 252
9.4 解一般非线性规划的神经网络 258
9.5 解绝对值形式(L1范数)的目标函数的非线性规划的神经网络 270
9.7 解具有线性约束的非线性规划的神经网络 279
9.8 解离散时间最优控制问题的神经网络 283
9.9 解离散时间动态规划的神经网络 290
参考文献 294
9.6 解最小最大问题的神经网络 373