当前位置:首页 > 工业技术
深入浅出强化学习  原理入门
深入浅出强化学习  原理入门

深入浅出强化学习 原理入门PDF电子书下载

工业技术

  • 电子书积分:10 积分如何计算积分?
  • 作 者:郭宪,方勇纯编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2018
  • ISBN:9787121329180
  • 页数:239 页
图书介绍:阿法狗击败世界围棋冠军柯洁,标志着人工智能进入一个新的阶段。阿法狗背后的核心算法——深度强化学习——成为继深度学习之后广泛受人关注的前沿热点。本书由浅入深地阐述了强化学习的基础理念与实践,包括数学基础、强化学习基本原理、强化学习的应用与实践,是一本零基础的入门学习书籍。
《深入浅出强化学习 原理入门》目录

1绪论 1

1.1这是一本什么书 1

1.2强化学习可以解决什么问题 2

1.3强化学习如何解决问题 4

1.4强化学习算法分类及发展趋势 5

1.5强化学习仿真环境构建 7

1.5.1 gym安装及简单的demo示例 8

1.5.2深入剖析gym环境构建 10

1.6本书主要内容及安排 12

第一篇 强化学习基础 17

2马尔科夫决策过程 18

2.1马尔科夫决策过程理论讲解 18

2.2 MDP中的概率学基础讲解 26

2.3基于gym的MDP实例讲解 29

2.4习题 34

3基于模型的动态规划方法 36

3.1基于模型的动态规划方法理论 36

3.2动态规划中的数学基础讲解 47

3.2.1线性方程组的迭代解法 47

3.2.2压缩映射证明策略评估的收敛性 49

3.3基于gym的编程实例 52

3.4最优控制与强化学习比较 54

3.5习题 56

第二篇 基于值函数的强化学习方法 57

4基于蒙特卡罗的强化学习方法 58

4.1基于蒙特卡罗方法的理论 58

4.2统计学基础知识 67

4.3基于Python的编程实例 71

4.4习题 74

5基于时间差分的强化学习方法 75

5.1基于时间差分强化学习算法理论讲解 75

5.2基于Python和gym的编程实例 83

5.3习题 87

6基于值函数逼近的强化学习方法 88

6.1基于值函数逼近的理论讲解 88

6.2 DQN及其变种 94

6.2.1 DQN方法 94

6.2.2 Double DQN 100

6.2.3优先回放(Prioritized Replay) 102

6.2.4 Dueling DQN 104

6.3函数逼近方法 105

6.3.1基于非参数的函数逼近 105

6.3.2基于参数的函数逼近 111

6.3.3卷积神经网络 117

6.4习题 123

第三篇 基于直接策略搜索的强化学习方法 125

7基于策略梯度的强化学习方法 126

7.1基于策略梯度的强化学习方法理论讲解 126

7.2基于gym和TensorFlow的策略梯度算法实现 134

7.2.1安装Tensorflow 135

7.2.2策略梯度算法理论基础 135

7.2.3 Softmax策略及其损失函数 136

7.2.4基于TensorFlow的策略梯度算法实现 138

7.2.5基于策略梯度算法的小车倒立摆问题 141

7.3习题 141

8基于置信域策略优化的强化学习方法 142

8.1理论基础 143

8.2 TRPO中的数学知识 153

8.2.1信息论 153

8.2.2优化方法 155

8.3习题 164

9基于确定性策略搜索的强化学习方法 165

9.1理论基础 165

9.2习题 170

10基于引导策略搜索的强化学习方法 171

10.1理论基础 171

10.2 GPS中涉及的数学基础 178

10.2.1监督相LBFGS优化方法 178

10.2.2 ADMM算法 179

10.2.3 KL散度与变分推理 183

10.3习题 184

第四篇 强化学习研究及前沿 185

11逆向强化学习 186

11.1概述 186

11.2基于最大边际的逆向强化学习 187

11.3基于最大熵的逆向强化学习 194

11.4习题 201

12组合策略梯度和值函数方法 202

13值迭代网络 207

13.1为什么要提出值迭代网络 207

13.2值迭代网络 210

14基于模型的强化学习方法:PILCO及其扩展 214

14.1概述 214

14.2 PILCO 216

14.3滤波PILCO和探索PILCO 226

14.3.1滤波PILCO算法 227

14.3.2有向探索PILCO算法 230

14.4深度PILCO 232

后记 235

参考文献 237

相关图书
作者其它书籍
返回顶部