第一章 最短行军路线问题 1
1.1 最短行军路线问题 1
1.2 最短行军路线问题的数学模型 4
1.3 最短行军路线问题的顺序解法 10
第二章 动态规划的基本概念和基本原理 12
2.1 动态规划的基本概念 12
2.2 动态规划的基本原理 13
2.3 最优化原理 14
2.4 动态规划的基本方程(数学模型) 16
2.5 可逆过程及其顺序解法 17
第三章 动态规划的应用 19
3.1 气象导航问题 19
3.2 武器指挥决策系统的火力分配问题 22
3.3 搜索力的最优分配问题 44
3.4 战斗时间的优化问题 48
3.5 最优装载问题 54
3.6 复合系统的可靠性问题 56
3.7 多级火箭的最优设计问题 61
3.8 生产计划问题 63
3.9 海图成图周期的优化问题 68
3.10 实验仪器使用问题 70
第四章 不定期与无期动态规划 74
4.1 不定期最优路线问题 74
4.2 函数迭代法 76
4.3 策略迭代法 83
4.4 不定期动态规划 90
4.5 无期动态规划 93
第五章 随机性动态规划 97
5.1 随机性决策过程的基本概念 97
5.2 马尔可夫决策过程 98
5.3 (MDP)的有限阶段目标函数模型 99
5.4 (MDP)的F有限折扣目标函数模型 109
5.5 独立干扰的决策过程 118
第六章 连续型动态规划 123
6.1 连续型动态规划模型 123
6.2 最优性的必要条件--HJB方程 126
6.3 应用举例 128
第七章 微分动态规划 132
7.1 引言 132
7.2 策略局部微调的微分动态规划(DDP-CM) 134
7.3 策略全局调整的微分动态规划(DDP-CJ) 137
7.4 算法的收敛性 140
练习题 143
练习题答案 155