第一章 问题的提法与数学模型 1
1.1 离散时间系统的最优控制问题 1
1.2 数学规划模型 3
1.3 连续时间系统的最优控制问题 6
1.4 泛函极值模型 9
第二章 数学规划基本理论 12
2.1 无约束极值及等式约束极值理论 12
2.2 库恩—塔克(Kuhn-Tucker)理论 14
2.3 拉格朗日对偶性与鞍点最优性 21
2.4 算法的基本性质 25
第三章 最大值原理基本理论 31
3.1 连续时间系统最大值原理的若干形式 31
3.2 最大值原理的证明 37
3.3 最大值原理的证明(泛函分析方法) 49
3.4 登月艇的软着陆推力控制问题 55
3.5 离散时间系统的最大值原理 60
第四章 动态规划基本理论 70
4.1 离散时间系统的动态规划理论 70
4.2 具有二次型指标函数的线性系统最优控制问题(离散时间系统) 77
4.3 连续时间系统的动态规划理论 80
4.4 最速控制与二次型指标线性系统最优控制问题(连续时间系统) 88
4.5 动态规划常规算法 94
4.6 动态规划与最大值原理的关系 98
第五章 离散时间系统最优控制问题的数值方法 104
5.1 无约束算法,最速下降法与牛顿法 104
5.2 无约束算法,共轭梯度法与拟牛顿法 114
5.3 有约束算法 122
5.4 离散时间系统动态规划的特殊算法 134
5.5 离散时间系统的微分动态规划 140
第六章 连续时间系统最优控制问题的数值方法 147
6.1 函数空间中梯度的求法 147
6.2 函数空间中的最速下降法与共轭梯度法 154
6.3 函数空间中的牛顿法 156
6.4 连续时间系统的微分动态规划 161
第七章 离散时间系统的随机最优控制 165
7.1 问题的提法 165
7.2 离散时间系统的随机动态规划 168
7.3 状态信息不完整的随机控制问题 171
7.4 次优控制技术 179
第八章 连续时间系统的随机最优控制 185
8.1 连续随机过程与随机微分方程 185
8.2 马尔可夫扩散过程 190
8.3 卡尔曼—布西滤波器 197
8.4 受控马尔可夫过程的动态规划理论 204
8.5 连续时间的线性二次随机最优控制 210
8.6 信息不完整的情况 218
第九章 最优控制中的神经网络技术 224
9.1 神经网络的基本概念和组成 224
9.2 神经网络模型 231
9.3 解凸二阶规划的神经网络 241
9.4 解一般非线性规划的神经网络 248
9.5 解绝对值形式(L1范数)的目标函数的非线性规划的神经网络 259
9.6 解最小最大问题的神经网络 263
9.7 解具有线性约束的非线性规划的神经网络 267
9.8 解离散时间最优控制问题的神经网络 271
9.9 解离散时间动态规划的神经网络 279
第十章 基于粒子群算法和遗传算法的多目标优化 283
10.1 多目标优化的基本原理 283
10.2 进化算法的基本概念 285
10.3 多目标进化算法 289
10.4 基于遗传算法的多目标优化方法 294
10.5 基于粒子群优化算法的多目标优化方法 297
10.6 基于MATLAB的仿真与分析 300
第十一章 基于模拟退火算法和人工免疫算法的多目标优化 313
11.1 基于模拟退火算法的多目标优化 313
11.2 基于人工免疫算法的多目标优化 321
参考文献 332