《卷积神经网络与计算机视觉》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:(澳)萨尔曼·汗(Salman Khan)著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2019
  • ISBN:9787111622888
  • 页数:184 页
图书介绍:本书既全面介绍了卷积神经网络(CNN)的原理,又提供了将CNN应用于计算机视觉的一手经验。书中首先讲解神经网络的基本概念(训练、正则化和优化),然后讨论各种各样的损失函数、网络层和流行的CNN架构,回顾了评估CNN的不同技术,并介绍了一些常用的CNN工具和库。此外,本书还分析了CNN在计算机视觉中的应用案例,包括图像分类、目标检测、语义分割、场景理解和图像生成。

第1章 简介 2

1.1 什么是计算机视觉 2

1.1.1 应用案例 3

1.1.2 图像处理与计算机视觉 4

1.2 什么是机器学习 6

1.2.1 为什么需要深度学习 7

1.3 本书概览 8

第2章 特征和分类器 12

2.1 特征和分类器的重要性 12

2.1.1 特征 12

2.1.2 分类器 14

2.2 传统特征描述符 14

2.2.1 方向梯度直方图 15

2.2.2 尺度不变特征变换 17

2.2.3 加速健壮特征 21

2.2.4 传统的手工工程特征的局限性 22

2.3 机器学习分类器 23

2.3.1 支持向量机 24

2.3.2 随机决策森林 28

2.4 总结 31

第3章 神经网络基础 33

3.1 引言 33

3.2 多层感知机 34

3.2.1 基础架构 34

3.2.2 参数学习 35

3.3 循环神经网络 39

3.3.1 基础架构 39

3.3.2 参数学习 41

3.4 与生物视觉的关联 41

3.4.1 生物神经元模型 41

3.4.2 神经元的计算模型 42

3.4.3 人工神经元与生物神经元 44

第4章 卷积神经网络 45

4.1 引言 45

4.2 神经网络层 46

4.2.1 预处理 46

4.2.2 卷积层 48

4.2.3 池化层 55

4.2.4 非线性 56

4.2.5 全连接层 58

4.2.6 转置卷积层 59

4.2.7 感兴趣区域的池化层 61

4.2.8 空间金字塔池化层 63

4.2.9 局部特征聚合描述符层 65

4.2.10 空间变换层 66

4.3 CNN损失函数 67

4.3.1 交叉熵损失函数 68

4.3.2 SVM铰链损失函数 69

4.3.3 平方铰链损失函数 69

4.3.4 欧几里得损失函数 69

4.3.5 ?1误差 69

4.3.6 对比损失函数 70

4.3.7 期望损失函数 70

4.3.8 结构相似性度量 71

第5章 CNN学习 72

5.1 权重初始化 72

5.1.1 高斯随机初始化 72

5.1.2 均匀随机初始化 73

5.1.3 正交随机初始化 73

5.1.4 无监督的预训练 73

5.1.5 泽维尔(Xavier)初始化 74

5.1.6 ReLU敏感的缩放初始化 74

5.1.7 层序单位方差 74

5.1.8 有监督的预训练 75

5.2 CNN的正则化 76

5.2.1 数据增强 77

5.2.2 随机失活 78

5.2.3 随机失连 79

5.2.4 批量归一化 79

5.2.5 集成模型平均 81

5.2.6 ?2正则化 81

5.2.7 ?1正则化 82

5.2.8 弹性网正则化 82

5.2.9 最大范数约束 82

5.2.10 早停 83

5.3 基于梯度的CNN学习 83

5.3.1 批量梯度下降 84

5.3.2 随机梯度下降 84

5.3.3 小批量梯度下降 85

5.4 神经网络优化器 85

5.4.1 动量 86

5.4.2 涅斯捷罗夫动量 87

5.4.3 自适应梯度 87

5.4.4 自适应增量 88

5.4.5 RMSprop 89

5.4.6 自适应矩估计 89

5.5 CNN中的梯度计算 91

5.5.1 分析微分法 91

5.5.2 数值微分法 92

5.5.3 符号微分法 92

5.5.4 自动微分法 93

5.6 通过可视化理解CNN 96

5.6.1 可视化学习的权重 97

5.6.2 可视化激活 97

5.6.3 基于梯度的可视化 100

第6章 CNN架构的例子 104

6.1 LeNet 104

6.2 AlexNet 105

6.3 NiN 106

6.4 VGGnet 107

6.5 GoogleNet 108

6.6 ResNet 110

6.7 ResNeXt 114

6.8 FractalNet 115

6.9 DenseNet 116

第7章 CNN在计算机视觉中的应用 119

7.1 图像分类 119

7.1.1 PointNet 120

7.2 目标检测与定位 122

7.2.1 基于区域的CNN 122

7.2.2 快速R-CNN 124

7.2.3 区域建议网络 126

7.3 语义分割 129

7.3.1 全卷积网络 129

7.3.2 深度反卷积网络 133

7.3.3 DeepLab 136

7.4 场景理解 138

7.4.1 DeepContext 138

7.4.2 从RGB-D图像中学习丰富的特征 142

7.4.3 用于场景理解的PointNet 144

7.5 图像生成 145

7.5.1 生成对抗网络 145

7.5.2 深度卷积生成对抗网络 149

7.5.3 超分辨率生成对抗网络 151

7.6 基于视频的动作识别 153

7.6.1 静止视频帧的动作识别 153

7.6.2 双流CNN 156

7.6.3 长期递归卷积网络 158

第8章 深度学习工具和库 161

8.1 Caffe 161

8.2 TensorFlow 162

8.3 MatConvNet 163

8.4 Torch7 163

8.5 Theano 164

8.6 Keras 165

8.7 Lasagne 165

8.8 Marvin 167

8.9 Chainer 167

8.10 PyTorch 168

第9章 结束语 170

9.1 本书概要 170

9.2 未来研究方向 170

术语表 173

参考文献 176