《机器学习理论、方法及应用》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:王雪松,程玉虎著
  • 出 版 社:北京:科学出版社
  • 出版年份:2009
  • ISBN:9787030254399
  • 页数:177 页
图书介绍:本书主要围绕基于神经网络的学习、强化学习和进化学习3个方面阐述机器学习理论、方法及其应用,共3部分13章。第一部分是神经网络学习及其在复杂非线性系统中的控制,第二部分是强化学习的大规模或连续空间表示问题,第三部分则是对分布估计优化算法进行研究,为便于应用本书阐述的算法,书后附有部分机器学习算法源程序。

第1章 机器学习概述 1

1.1 机器学习的概念 1

1.2 机器学习的发展历史 3

1.3 机器学习的分类 4

1.3.1 基于学习策略的分类 4

1.3.2 基于学习方法的分类 4

1.3.3 基于学习方式的分类 4

1.3.4 基于数据形式的分类 5

1.3.5 基于学习目标的分类 5

1.4 机器学习的主要策略 5

1.4.1 基于神经网络的学习 6

1.4.2 进化学习 9

1.4.3 强化学习 14

1.5 本书主要内容及安排 16

1.6 本章小结 17

参考文献 18

第2章 基于时间差分的神经网络预测控制 22

2.1 方法的提出 23

2.2 基于时间差分的Elman网络预测控制 24

2.2.1 Elman网络预测模型 24

2.2.2 反馈校正模型 26

2.2.3 参考轨迹 27

2.2.4 滚动优化算法 27

2.3 仿真研究 28

2.3.1 预测仿真 28

2.3.2 跟踪仿真 29

2.4 本章小结 30

参考文献 30

第3章 基于径向基函数网络的机械手迭代学习控制 31

3.1 机械手迭代学习控制 32

3.2 基于RBF网络的迭代学习控制 32

3.2.1 选取查询点的k个最接近样例 33

3.2.2 利用RBF网络拟合k个数据点 33

3.2.3 预测查询点的控制输入 34

3.3 仿真研究 35

3.4 本章小结 36

参考文献 36

第4章 自适应T-S型模糊径向基函数网络 38

4.1 RBF网络和模糊推理系统的功能等价性 39

4.2 自适应T-S型FRBF网络结构 40

4.3 自适应T-S型FRBF网络学习 41

4.3.1 网络学习动态 42

4.3.2 网络结构学习 42

4.3.3 网络参数学习 44

4.3.4 算法步骤 45

4.4 仿真研究 45

4.5 本章小结 47

参考文献 47

第5章 基于强化学习的自适应PID控制 48

5.1 Actor-Critic学习 49

5.2 基于强化学习的自适应PID控制 50

5.2.1 基于强化学习的自适应PID控制结构 50

5.2.2 基于RBF网络的Actor-Critic学习 51

5.3 控制器设计步骤 53

5.4 仿真研究 53

5.5 本章小结 54

参考文献 55

第6章 基于动态回归网络的强化学习控制 56

6.1 Q学习 56

6.2 基于Elman网络的强化学习控制 57

6.2.1 基于Elman网络的Q学习 57

6.2.2 Elman网络学习算法 59

6.2.3 基于Elman网络的Q学习方法步骤 60

6.3 仿真研究 60

6.4 本章小结 62

参考文献 63

第7章 基于自适应FRBF网络的强化学习 64

7.1 基于自适应FRBF网络的Actor-Critic学习 64

7.1.1 基于自适应FRBF网络的Actor-Critic学习结构 64

7.1.2 自适应FRBF网络的学习 65

7.1.3 算法步骤 67

7.1.4 仿真研究 68

7.2 基于自适应FRBF网络的Q学习 72

7.2.1 基于自适应FRBF网络的Q学习结构 72

7.2.2 自适应FRBF网络的学习 74

7.2.3 算法步骤 75

7.2.4 仿真研究 75

7.3 本章小结 78

参考文献 79

第8章 基于支持向量机的强化学习 80

8.1 SVM 80

8.1.1 机器学习 80

8.1.2 核学习 82

8.1.3 SVM的思想 82

8.1.4 SVM的重要概念 83

8.2 基于SVM的强化学习 84

8.2.1 基于SVM的Q学习结构 84

8.2.2 基于滚动时间窗机制的SVM 86

8.2.3 算法步骤 87

8.2.4 仿真研究 88

8.3 基于协同最小二乘SVM的强化学习 89

8.3.1 基于协同最小二乘SVM的Q学习 90

8.3.2 LS-SVRM逼近状态动作对到值函数的映射关系 92

8.3.3 LS-SVCM逼近状态空间到动作空间的映射关系 93

8.3.4 仿真研究 93

8.4 本章小结 96

参考文献 96

第9章 基于高斯过程分类器的强化学习 98

9.1 基于高斯过程分类器的强化学习 98

9.2 在线高斯过程分类器学习 99

9.3 算法步骤 101

9.4 仿真研究 102

9.5 本章小结 105

参考文献 106

第10章 基于图上测地高斯基函数的策略迭代强化学习 107

10.1 环境的图论描述 108

10.2 测地高斯基函数 109

10.3 递归最小二乘策略迭代 111

10.4 算法步骤 112

10.5 仿真研究 112

10.6 本章小结 114

参考文献 115

第11章 多目标优化问题的差分进化-分布估计算法 116

11.1 多目标优化 117

11.2 多目标优化的差分进化-分布估计算法 117

11.2.1 多目标优化的DE-EDA混合算法步骤 118

11.2.2 多目标优化的DE子代生成策略 119

11.2.3 多目标优化的EDA子代生成策略 121

11.3 实例研究 121

11.4 本章小结 130

参考文献 130

第12章 基于细菌觅食行为的分布估计算法在预测控制中的应用 132

12.1 方法的提出 133

12.2 基于改进分布估计算法的预测控制 133

12.2.1 预测模型 133

12.2.2 反馈校正模型 134

12.2.3 基于改进分布估计算法的滚动优化 134

12.3 实验分析 136

12.3.1 Benchmark函数实验 136

12.3.2 预测控制的曲线跟踪实验 139

12.4 本章小结 140

参考文献 141

第13章 一种多样性保持的分布估计算法 142

13.1 混沌模型 143

13.2 多样性保持分布估计算法 143

13.3 Benchmark函数实验 146

13.4 在支持向量机参数选择中的应用 152

13.4.1 算法步骤 152

13.4.2 Chebyshev混沌时间序列预测 153

13.5 本章小结 157

参考文献 157

附录 部分机器学习算法MATLAB源程序 159

程序1 第11章 多目标差分进化-分布估计算法MATLAB源程序 159

程序2 第12章 基于细菌觅食行为的分布估计算法部分MATLAB源程序 166

程序3 第13章 一种多样性保持的分布估计算法部分MATLAB程序 172