第1章 引论 1
1.1 概述 1
1.2 人工智能简史 2
1.3 人工智能的研究途径及主要方法 3
1.4 人工智能发展趋势 4
第2章 智能体 5
2.1 智能体 5
2.2 性能度量 6
2.3 任务环境的属性 6
2.4 常见智能体 7
2.4.1 反射智能体 7
2.4.2 基于目标的智能体 8
第3章 搜索 10
3.1 问题求解智能体 10
3.1.1 定义明确的问题及解 11
3.1.2 问题的形式化 12
3.2 一般搜索系统 12
3.3 无信息搜索策略 15
3.3.1 广度优先搜索 15
3.3.2 一致费用搜索 16
3.3.3 深度优先搜索 17
3.3.4 深度受限搜索 18
3.3.5 迭代深入搜索 19
3.4 启发式搜索 20
3.4.1 贪婪最佳搜索 20
3.4.2 A*搜索 22
3.4.3 启发函数 25
3.5 局部搜索算法 26
3.5.1 爬山法 27
3.5.2 模拟退火搜索 28
3.5.3 遗传算法 29
第4章 约束可满足性问题 31
4.1 概述 31
4.2 实例及形式化 32
4.3 分类 34
4.4 搜索方法 35
4.4.1 CSP问题的回溯搜索 35
4.4.2 通过约束传播信息 38
4.5 约束满足的局部搜索 41
4.6 问题的结构 41
4.6.1 子结构 41
4.6.2 树状结构 42
第5章 对抗搜索 43
5.1 博弈 43
5.2 博弈中的优化决策 43
5.2.1 最优决策 44
5.2.2 极小极大算法 45
5.2.3 多人游戏中的最优策略 46
5.3 α-β剪枝 47
5.4 不完整的实时决策 49
第6章 马尔可夫决策过程 51
6.1 最大化期望效用原理 51
6.2 效用理论基础 52
6.2.1 理性偏好的约束 52
6.2.2 效用函数 53
6.3 马尔可夫决策过程 57
6.4 值迭代 62
6.5 策略迭代 66
第7章 增强学习 68
7.1 被动增强学习 69
7.1.1 直接状态估计 70
7.1.2 基于模型的估计 70
7.2 时序差分学习 72
7.3 主动增强学习 74
7.3.1 探索与利用 74
7.3.2 学习Q值函数 75
7.4 增强学习的一般化 76
7.4.1 增强学习在博弈中的应用 77
7.4.2 增强学习在机器人中的应用 78
第8章 概率推理 79
8.1 概述 79
8.2 概率基础 82
8.3 概率推理 87
8.4 贝叶斯网络 93
8.5 贝叶斯网络的独立性 96
8.6 贝叶斯网络的推理 99
8.6.1 穷举法推理 100
8.6.2 消除变量法 100
8.7 贝叶斯网络的近似推理 104
第9章 基于时间的推理 107
9.1 时间与不确定性 107
9.1.1 状态与观察 107
9.1.2 稳态马尔可夫模型 108
9.2 时序模型中的推理 109
9.3 隐马尔可夫模型 110
9.4 粒子(质点)滤波 114
9.5 动态贝叶斯网络 115
第10章 机器学习 116
10.1 朴素贝叶斯 116
10.1.1 基本概念 117
10.1.2 基本模型 117
10.1.3 过拟合 120
10.2 感知器 122
10.2.1 特征 122
10.2.2 生成模型和判别模型 123
10.2.3 线性分类器 123
10.2.4 二元分类 124