《计算机视觉教程》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:章毓晋编著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2017
  • ISBN:9787115441546
  • 页数:348 页
图书介绍:本书系统地介绍了计算机视觉方面的基础知识,详细讨论了从图像自动抽取重要信息的相关理论。内容包括图像采集、图像预处理、基元检测、目标分割、目标表达和描述、纹理特性分析、形状特性分析、立体视觉、三维景物恢复、运动特性分析、景物识别、广义匹配、时空行为了解、场景解释及计算机视觉系统。全书取材新颖精练,重点突出,例题经典,以解决实际问题为目的。

第1章 绪论 1

1.1 计算机视觉 1

1.1.1 视觉概述 1

1.1.2 计算机视觉的目标 2

1.1.3 相关学科 3

1.1.4 应用领域 4

1.2 图像基础 5

1.2.1 图像及类别 5

1.2.2 图像表达和显示 7

1.2.3 图像存储 8

1.3 像素间联系 11

1.3.1 像素邻域 11

1.3.2 像素间距离 12

1.4 本书内容提要 15

1.4.1 计算机视觉系统及模块 15

1.4.2 如何学习使用本书 16

总结和复习 19

第2章 图像采集 21

2.1 采集装置 21

2.2 采集模型 23

2.2.1 几何成像模型 23

2.2.2 亮度成像模型 29

2.2.3 空间和幅度分辨率 31

2.3 采集方式 32

2.3.1 成像方式一览 33

2.3.2 结构光法 33

2.4 摄像机标定 35

2.4.1 标定程序和步骤 35

2.4.2 两级标定法 38

总结和复习 41

第3章 图像预处理 43

3.1 坐标变换 43

3.1.1 基本坐标变换 43

3.1.2 几何失真校正 45

3.2 灰度映射 47

3.2.1 灰度映射原理 47

3.2.2 灰度映射示例 48

3.3 直方图修正 49

3.3.1 直方图均衡化 50

3.3.2 直方图规定化 52

3.4 空域滤波 55

3.4.1 原理和分类 55

3.4.2 线性平滑滤波 57

3.4.3 线性锐化滤波 58

3.4.4 非线性平滑滤波 59

3.4.5 非线性锐化滤波 62

总结和复习 63

第4章 基元检测 65

4.1 边缘检测 65

4.1.1 检测原理 66

4.1.2 一阶导数算子 67

4.1.3 二阶导数算子 70

4.1.4 边界闭合 74

4.1.5 边界细化 75

4.2 SUSAN算子 76

4.2.1 USAN原理 76

4.2.2 角点和边缘检测 77

4.3 哈里斯兴趣点算子 80

4.4 哈夫变换 82

4.4.1 基本哈夫变换 82

4.4.2 广义哈夫变换 85

4.4.3 完整广义哈夫变换 87

4.5 椭圆定位和检测 88

4.6 位置直方图技术 90

总结和复习 92

第5章 目标分割 94

5.1 轮廓搜索 94

5.1.1 图搜索 95

5.1.2 动态规划 96

5.2 主动轮廓模型 97

5.2.1 主动轮廓 97

5.2.2 能量函数 98

5.3 基本阈值技术 100

5.3.1 原理和分类 100

5.3.2 全局阈值的选取 102

5.3.3 局部阈值的选取 104

5.3.4 动态阈值的选取 106

5.4 特色阈值方法 107

5.4.1 多分辨率阈值 107

5.4.2 过渡区阈值 109

5.5 特征空间聚类 111

5.5.1 基本聚类方法 111

5.5.2 均移确定聚类中心 112

总结和复习 113

第6章 目标表达和描述 115

6.1 基于边界的表达 115

6.1.1 链码 116

6.1.2 边界段和凸包 117

6.1.3 边界标记 118

6.2 基于区域的表达 120

6.2.1 四叉树 120

6.2.2 围绕区域 121

6.2.3 骨架 122

6.3 基于边界的描述 124

6.3.1 边界长度和直径 124

6.3.2 边界形状数 125

6.3.3 轮廓形状矩阵 126

6.4 基于区域的描述 127

6.4.1 区域面积和密度 127

6.4.2 区域形状数 128

6.4.3 区域不变矩 129

6.4.4 拓扑描述符 131

总结和复习 132

第7章 纹理分析 134

7.1 统计描述方法 134

7.1.1 灰度共生矩阵 135

7.1.2 基于共生矩阵的描述 136

7.1.3 基于能量的描述 137

7.2 结构描述方法 139

7.2.1 结构描述原理 139

7.2.2 纹理镶嵌 141

7.2.3 局部二值模式 142

7.3 频谱描述方法 144

7.3.1 傅里叶频谱描述 144

7.3.2 盖伯频谱描述 145

7.4 纹理图像分割 147

7.4.1 有监督纹理分割 148

7.4.2 无监督纹理分割 150

总结和复习 152

第8章 形状分析 154

8.1 形状紧凑性描述符 155

8.2 形状复杂性描述符 160

8.3 基于多边形的形状分析 163

8.3.1 多边形计算 163

8.3.2 多边形描述 164

8.4 基于曲率的形状分析 166

8.4.1 轮廓曲率 166

8.4.2 曲面曲率 169

总结和复习 170

第9章 立体视觉 172

9.1 立体视觉模块 172

9.2 双目成像和视差 174

9.2.1 双目横向模式 174

9.2.2 双目横向会聚模式 176

9.2.3 双目纵向模式 177

9.3 基于区域的立体匹配 178

9.3.1 模板匹配 179

9.3.2 双目立体匹配 180

9.4 基于特征的立体匹配 186

9.4.1 点对点的方法 186

9.4.2 动态规划匹配 188

总结和复习 189

第10章 三维景物恢复 192

10.1 由光移恢复表面朝向 193

10.1.1 表面反射特性 193

10.1.2 目标表面朝向 196

10.1.3 反射图 196

10.1.4 光度立体学求解 198

10.2 从影调获取形状信息 199

10.2.1 影调与形状 199

10.2.2 求解亮度方程 202

10.3 纹理变化与表面朝向 204

10.3.1 三种典型变化 204

10.3.2 确定线段的纹理消失点 206

10.4 根据焦距确定深度 209

总结和复习 210

第11章 运动分析 212

11.1 运动分类和表达 213

11.2 全局运动检测 216

11.2.1 利用图像差的运动检测 216

11.2.2 基于模型的运动检测 219

11.3 运动目标检测和分割 221

11.3.1 背景建模 221

11.3.2 运动目标跟踪 225

11.3.3 运动目标分割 229

11.4 运动光流和表面取向 230

11.4.1 光流约束方程 230

11.4.2 光流计算 231

11.4.3 光流与表面取向 235

总结和复习 238

第12章 景物识别 240

12.1 统计模式分类 240

12.1.1 模式分类原理 241

12.1.2 最小距离分类器 241

12.1.3 最优统计分类器 242

12.2 感知机 246

12.3 支持向量机 249

12.4 结构模式识别 252

12.4.1 字符串结构识别 252

12.4.2 树结构识别 255

总结和复习 257

第13章 广义匹配 259

13.1 目标匹配 260

13.1.1 匹配的度量 260

13.1.2 字符串匹配 263

13.1.3 惯量等效椭圆匹配 264

13.2 动态模式匹配 266

13.3 关系匹配 269

13.3.1 关系表达和距离 269

13.3.2 关系匹配模型 270

13.4 图同构匹配 272

13.4.1 图论基础 272

13.4.2 图同构和匹配 275

总结和复习 276

第14章 时空行为理解 279

14.1 时空技术 279

14.2 时空兴趣点 281

14.3 动态轨迹学习和分析 283

14.3.1 自动场景建模 283

14.3.2 路径学习 285

14.3.3 自动活动分析 287

14.4 动作分类和识别 288

14.4.1 动作分类 288

14.4.2 动作识别 290

14.5 活动和行为建模 293

14.5.1 动作建模 294

14.5.2 活动建模和识别 297

总结和复习 301

第15章 场景解释 303

15.1 线条图标记解释 303

15.2 体育比赛视频排序 306

15.3 计算机视觉系统模型 311

15.3.1 多层次串行结构 311

15.3.2 知识库为中心的辐射结构 312

15.3.3 知识库为根的树结构 313

15.3.4 多模块交叉配合结构 314

15.4 计算机视觉理论框架 315

15.4.1 马尔视觉计算理论 315

15.4.2 对马尔理论框架的改进 318

15.4.3 新理论框架的研究 319

总结和复习 321

部分练习题解答 323

参考文献 329

索引 338