《计算机视觉与模式识别》PDF下载

购买积分：14 如何计算积分？
作　　者：郑南宁著
出版社：北京：国防工业出版社
出版年份：1998
ISBN：7118017914
页数：418 页

图书介绍：本书系统、深入地介绍计算机视觉与模式识别研究领域中的基础理论及各种新的处理方法与技术。全书共十三章：第一章概述计算机视觉与模式识别的基本研究内容、特点、应用、现状与未来，强调认识和理解计算机视觉与模式识别研究领域之间的联系；第二章介绍图像生成的几何模型、统计特性以及摄像机标定与运动控制方法；第三、四、五、六、七、八章分别讨论视觉信息处理与理解的若干基本方法：边缘检测与自适应平滑滤波、图像分割、形状描述与分析、三维感知、运动视觉、基于cad模型的三维机器视觉；第九、十、十一、十二章分别讨论与计算机视觉和模式识别学科的未来发展有着密切关系的一个新的研究分支--神经网络模型以及前馈网络的学习算法与特征提取；第十三章讨论视觉早期过程的多频率通道模型和基于小波变换的初级视觉模型，介绍一种闭环视觉系统与视觉的选择性注意力机制。本书可供从事智能控制与模式识别研究的研究人员及工程技术人员参考，也可供信息处理、自动控制、生物医学工程及计算机应用等专业的高年级学生和研究生阅读。

点击购买此书全本PDF电子书

第一章引论 1

1.1 计算机视觉的研究内容与困难 1

1.1.1 计算机视觉研究的基本内容与核心问题 1

前言页 1

1.1.2 传统Shape from X方法的局限性与知识在视觉信息理解中的重要性 3

1.2 计算视觉的正则化理论 5

1.2.1 初级视觉与不适定问题 6

1.2.2 正则化理论的局限性 7

1.3.1 模式识别的基本概念 8

1.3 模式识别与神经元网络 8

1.3.2 神经元网络与神经计算 9

1.3.3 神经元平行处理与正则化方法 11

1.4 神经计算机在(视觉)高维数据处理中的应用 11

1.4.1 自适应增益控制(AGC) 11

1.4.2 AGC的硬件实现 12

1.4.3 高层次处理的广义AGC 13

1.4.4 数据选择引导 13

2.1.1 景物-图像的几何模型(3-D-2-D) 14

第二章图像表征与摄像机标定 14

2.1 透视投影变换 14

2.1.2 齐次坐标表示 16

2.1.3 透视投影中的直线与平面 18

2.1.4 任意坐标系中物体点的表示 18

2.1.5 2-D图像平面之间的变换 20

2.2 摄像机的标定 22

2.2.1 应用齐次坐标的摄像机标定 23

2.2.2 考虑透镜径向畸变的摄像机标定 24

2.2.3 利用径向排列约束(RAC)计算摄像机外部和内部参数 27

2.2.4 机器人手-眼(eye-on-hand)系统中摄像机相对机器人手臂空间位置的标定 31

2.3 摄像机的运动控制模型与算法 34

2.3.1 摄像机运动对图像平面点位置变化的影响 35

2.3.2 摄像机运动的控制算法 38

2.4 图像的随机线性模型 40

2.4.1 图像的随机场描述 41

2.4.2 图像的线性模型 41

2.4.4 统计过程 44

2.4.3 图像的空变模型 44

2.4.5 基于线性模型和高斯型白噪声的PDF的形式 45

第三章边缘检测 49

3.1 边缘检测的基本概念 49

3.2 基于经典微分算子的边缘检测 52

3.2.1 基于一阶微分的边缘检测算子 52

3.2.2 二阶微分--拉普拉斯算子 54

3.3.1 LOG滤波器 56

3.3 LOG滤波器与马尔-希尔德累思(Marr-Hildreth)边缘检测算子 56

3.3.2 LOG滤波器的计算实现 59

3.4 多灰度图像的边缘聚焦法 61

3.4.1 “边缘聚焦”的基本思想 62

3.4.2 “尺度空间”中的轮廓性质(轮廓变形与变形速度) 63

3.4.3 边缘聚焦算法 65

3.5 坎尼(Canny)边缘检测算子 66

3.5.1 坎尼算子的基本原理 66

3.5.2 坎尼算子的计算实现 67

3.6.1 自适应平滑的基本原理 69

3.6 基于梯度信息的自适应平滑滤波 69

3.6.2 自适应平滑算法 71

3.6.3 自适应平滑特征增强的边缘提取 73

3.6.4 高阶不连续性的保持 78

第四章图像分割模型与算法 80

4.1 图像分割的一般模型 80

4.1.1 图像分割的一般模型 80

4.1.2 图像分割的一般算法 81

4.2.2 简单阈值运算 82

4.2.1 灰度阈值分割的基本概念 82

4.2 灰度阈值分割法 82

4.2.3 最佳阈值选择 84

4.3 区域生长 86

4.3.1 区域生长的基本概念 86

4.3.2 用平均灰度分割 87

4.3.3 基于相似统计特性的分割 89

4.4 纹理结构分析 89

4.4.1 用空间自相关函数表示纹理结构 90

4.4.2 傅里叶功率谱法 90

4.4.3 联合概率矩阵(灰度共生矩阵)法 92

4.4.4 纹理结构的句法分析方法 94

4.4.5 子图像大小的选择 95

4.5 基于二维随机线性模型的图像区域分类与分割 96

4.5.1 图像分类 96

4.5.2 图像分割 97

4.6 用于图像分割的并行自适应层次化网络模型 99

4.6.1 并行自适应层次化图像分割网络模型 99

4.6.2 并行局部特征矢量计算 100

4.6.3 自组织均一化特征矢量聚类 101

4.6.4 基于全局分布特性的聚类决策 102

4.7 应用加博(Gabor)滤波器的纹理分割方法 104

4.7.1 加博函数 105

4.7.2 一维加博滤波器参数与一维纹理结构的关系 106

4.7.3 二维加博滤波器与纹理结构的关系 110

4.7.4 用于纹理分割的自适应加博滤波器的设计与实践 114

4.8 基于广义熵映射的图像分割方法 124

4.8.1 广义熵映射(GEM)模型 124

4.8.2 GEM在图像分割中的应用 129

第五章形状分析与描述 130

5.1 区域描述 130

5.1.1 傅里叶描绘子 130

5.1.2 基本几何描绘子 131

5.1.3 矩描绘子 132

5.1.4 拓扑描绘子 134

5.1.5 相似性描述 136

5.1.6 区域投影描述 137

5.1.7 基于傅里叶变换与梅林(Mellin)变换的几何形状RST不变性描述 139

5.2 图像描述的四叉树结构方法 140

5.2.1 四叉树基本概念 141

5.2.2 四叉树的建立 142

5.3 基于数字形态学的形状分析 143

5.3.1 图像形态学的闵可夫斯基(Minkowski)算子 143

5.3.2 闵可夫斯基算子在图像数据处理中的基本应用 148

5.3.3 复合结构元素的形态学算子的实现 151

5.3.4 图像的骨架比 151

5.4.1 霍夫变换的基本思想 154

5.4 区域边界的霍夫变换与广义霍夫变换 154

5.4.2 线段检测 155

5.4.3 圆检测 156

5.4.4 椭圆检测 157

5.4.5 广义霍夫变换与任意形状检测 159

5.5 基于边界斜率的二维目标形状分析与描述 160

5.5.1 二维形状分析与描述问题 160

5.5.2 二维形状边界曲线提取与曲线基元分割 161

5.5.3 基元参数估计 163

5.5.4 实验结果与讨论 165

第六章计算机视觉的三维感知 169

6.1 被动立体测定技术 169

6.1.1 光度体视测定法 169

6.1.2 由明暗恢复形状 173

6.1.3 由纹理和轮廓恢复形状 176

6.1.4 被动立体测距技术 179

6.1.5 根据单幅灰度图像的测距 182

6.2.1 结构光(光条法与主动立体视觉) 183

6.2 主动立体测定技术 183

6.2.2 莫尔阴影 184

6.2.3 飞行时间法(TOF) 185

6.2.4 三角测距法 187

6.2.5 散焦测距法(Range from Defocusing) 190

第七章运动视觉的建模、检测与估计 192

7.1 图像运动特征提取的基本方法 193

7.1.1 差分图像 193

7.1.4 图像变化检测 194

7.1.5 运动边缘检测 194

7.1.3 累积差分图像 194

7.1.2 三元(Ternary)运动描述 194

7.1.6 时空运动的频域分析 195

7.2 由局部光流恢复结构与运动参数估计 196

7.2.1 光流的基本特性 196

7.2.2 光流模型的基本方程 200

7.2.3 基于局部光流的运动估计 203

7.3 由全局光流场数据估计运动参数 207

7.3.1 已有运动参数估计方法的回顾 207

7.3.2 含有平移与旋转的光流约束方程 209

7.3.3 光流场环流的计算 210

7.3.4 FOE搜索算法 212

7.3.5 环流算法与FOE算法的比较 217

7.4 三维运动与结构估计 218

7.4.1 刚性物体假设 219

7.4.2 正交投影的运动分析 219

7.4.3 透视投影的运动分析(单目图像) 221

7.4.4 已知噪声分布的最优运动估计 223

7.4.5 未知噪声分布的最优运动估计 224

7.4.6 最优运动与结构估计的计算方法 226

7.5 由运动与立体观测恢复3-D结构 227

7.5.1 运动与立体的组成模型 227

7.5.2 刚体环境中应用多摄像机的其他方法 229

7.6 基于生物视觉运动感知原理的多速度运动检测 230

7.6.1 生物视觉运动感知的基本特征--方向选择性、速率选择性和侧抑制机制 230

7.6.2 具有速度选择性的运动检测子 232

7.6.3 MIVD的响应特性 234

7.6.4 一维多速度运动检测神经网络 240

7.6.5 并行分层二维多速度运动检测模型 243

第八章基于CAD模型的三维机器视觉 248

8.1 特征提取 248

8.1.1 链码边界跟踪 249

8.1.2 直线特征提取 249

8.1.3 用离散点拟合直线方程 250

8.2 基于线段快速匹配的立体视觉 253

8.2.1 成像几何 253

8.2.2 基于线段特征的局部匹配 256

8.2.3 利用线段结构关系的全局约束--最小深度误差准则 259

8.2.4 深度恢复 262

8.3 基于CAD几何模型的三维物体识别 264

8.3.1 CAD建模的基本概念 264

8.3.2 几何模型描述 266

8.3.3 面特征提取 269

8.3.4 点-线-面三级结构的图像数据快速匹配 271

8.3.5 空间变换矩阵的快速估计 273

8.3.6 假设检验与R、T矩阵的精确求解 274

第九章神经网络模型 277

9.1 生物神经元 277

9.2 人工神经元的基本模型 279

9.2.1 基本的神经元模型--麦卡劳奇-皮茨(McCulloch-Pitts)模型 279

9.2.2 神经元的福岛(Fukushima)模型 281

9.2.3 自适应线性神经元(Adaline) 282

9.2.4 单层感知机 286

9.2.5 霍普菲尔德(Hopfield)模型 289

9.2.6 格罗斯伯格(Grossberg)模型 291

9.2.7 广义的神经元模型 292

9.2.8 人工神经元的离散时间模型 292

9.3 人工神经网络模型 294

9.3.1 人工神经网络模型的基本特征和分类 294

9.3.2 前馈多层感知机 296

9.3.3 霍普菲尔德人工神经网络及其修正形式 298

9.3.4 离散时间霍普菲尔德模型 304

9.4 混沌状态下的神经网络模型的控制--一种信息融合的新方法 308

9.4.1 网络模型及其演化方程 309

9.4.2 网络的控制 310

9.4.3 用于信息融合的双模块模型 313

9.4.4 讨论 314

第十章前馈网络的学习算法与网络的推广能力 315

10.1 广义学习规则与B-P学习算法 315

10.1.1 单层感知机的学习 315

10.1.2 多层感知机的标准B-P学习算法 318

10.1.4 成批学习算法 323

10.1.3 带动量更新的B-P学习算法 323

10.1.5 在线和成批处理的比较 324

10.1.6 在隐含层内具有可变数目神经元的B-P学习算法 325

10.2 快速B-P学习算法 326

10.2.1 具有自适应激活函数斜率的B-P学习算法 326

10.2.2 搜索-收敛策略 326

10.2.3 平均方法 327

10.2.4 学习速率和/或动量率的整体自适应 327

10.2.5 学习率的局部自适应 329

10.3 单个神经元的广义学习算法 330

10.3.1 基本概念 330

10.2.6 快速传播算法(Quickprop) 330

10.3.2 广义LMS学习规则 331

10.3.3 势学习规则 334

10.3.4 相关学习规则 334

10.3.5 赫布学习规则 334

10.3.6 奥贾(Oja)学习规则 335

10.3.7 标准感知机学习规则 335

10.3.8 广义的感知机学习规则 335

10.4.1 网络结构与配置 336

10.4 前馈网络的隐结点个数与网络推广能力的关系 336

10.4.2 网络的容量与任务的复杂度 337

10.4.3 网络的学习和推广 338

10.4.4 配置容量与学习概率的计算 339

10.4.5 网络的推广能力与网络大小的关系 340

第十一章模式识别的贝叶斯决策方法与前馈网络的特征提取准则 343

11.1 贝叶斯决策理论 343

11.1.1 贝叶斯规则 343

11.1.2 贝叶斯决策与条件风险 344

11.1.3 二类问题的最小风险的贝叶斯检验 345

11.1.4 分类器与决策函数 346

11.1.5 误识概率 350

11.2 正态密度的决策函数 351

11.2.1 正态密度 351

11.2.2 决策函数 352

11.3 前馈网络的特征提取准则与贝叶斯决策 353

11.3.1 最小均方模式分析 354

11.3.2 前馈网络的非线性分析 357

11.3.3 极小化误差函数的物理意义与广义的网络特征提取准则 359

11.3.4 求和规则 360

11.3.5 模式加权与编码技术 361

第十二章自组织-时滞混合神经网络模型及其应用 365

12.1 自组织-时滞混合神经网络模型的基本结构 365

12.1.1 网络的输入--角特征矢量 366

12.1.2 自适应-时滞单元混合网络的结构 367

12.2 网络的学习算法与识别过程 367

12.2.1 网络的学习算法 367

12.2.2 网络的识别过程 369

12.2.3 实验结果 370

12.2.4 讨论 372

第十三章基于小波变换的初级视觉信息处理 374

13.1 人的视觉信息处理及其初级视觉过程的多频率通道模型 374

13.1.1 人的视觉感知的基本原理 374

13.1.2 初级视觉过程的多频率通道 376

13.2 小波变换及其快速算法 377

13.2.1 小波分析 377

13.2.2 时间-频率窗 378

13.2.3 二进小波及其快速算法 380

13.3 多分辨率分析 382

13.3.1 多分辨率逼近 382

13.3.2 多分辨率变换的实现 383

13.3.3 正交小波表示 384

13.3.4 正交小波表示的实现 385

13.3.5 由正交小波表示对信号进行重建 386

13.4 图像的正交小波表示 386

13.4.1 图像的正交小波分解 386

13.4.2 应用小波的图像重建 388

13.4.3 小波分解的一种快速算法 389

13.5 基于巴布(Bubble)小波的多尺度边缘提取 390

13.5.1 侧抑制现象与一维巴布函数的时频特性 390

13.5.2 二维巴布小波函数的构造及快速算法 392

13.5.3 多尺度边缘提取实例 393

13.6 应用香农(Shannon)小波包分解的纹理主频检测 396

13.6.1 应用小波包对纹理主频的检测 396

13.6.2 香农小波包 397

13.6.3 香农小波包的快速分解算法 399

13.6.4 应用香农小波包分解的纹理主频检测 401

13.7 基于小波的初级视觉模型 403

13.7.1 闭环初级视觉系统的基本概念 403

13.7.2 生物视觉系统 404

13.7.3 基于小波的感知细胞模型 405

13.8 闭环视觉系统与选择性注意力机制 409

13.8.1 实验构成 409

13.8.2 讨论 411

参考文献 411