第1章 引言 1
1.1动机 1
1.2计算机视觉为什么是困难的 2
1.3图像表达与图像分析的任务 4
1.4总结 7
1.5参考文献 7
第2章 图像及其表达与性质 8
2.1图像表达若干概念 8
连续图像函数 8
2.2图像数字化 10
2.2.1采样 10
2.2.2量化 11
2.3数字图像性质 12
2.3.1数字图像的度量和拓扑性质 12
2.3.2直方图 16
2.3.3熵 17
2.3.4图像的视觉感知 18
2.3.5图像品质 20
2.3.6图像中的噪声 20
2.4彩色图像 22
2.4.1色彩物理学 22
2.4.2人所感知的色彩 23
2.4.3彩色空间 26
2.4.4调色板图像 28
2.4.5颜色恒常性 28
2.5摄像机概述 29
2.5.1光敏传感器 29
2.5.2黑白摄像机 30
2.5.3彩色摄像机 32
2.6总结 33
2.7参考文献 34
第3章 图像及其数学与物理背景 35
3.1概述 35
3.1.1线性 35
3.1.2狄拉克(Dirac)分布和卷积 35
3.2积分线性变换 37
3.2.1作为线性系统的图像 37
3.2.2积分线性变换引言 37
3.2.3 1D傅里叶变换 38
3.2.4 2D傅里叶变换 41
3.2.5采样与香农约束 43
3.2.6离散余弦变换 46
3.2.7小波变换 47
3.2.8本征分析 51
3.2.9奇异值分解 52
3.2.10主分量分析 53
3.2.11其他正交图像变换 54
3.3作为随机过程的图像 55
3.4图像形成物理 57
3.4.1作为辐射测量的图像 57
3.4.2图像获取与几何光学 57
3.4.3镜头像差和径向畸变 60
3.4.4从辐射学角度看图像获取 62
3.4.5表面反射 64
3.5总结 67
3.6参考文献 67
第4章 图像分析的数据结构 69
4.1图像数据表示的层次 69
4.2传统图像数据结构 70
4.2.1矩阵 70
4.2.2链 72
4.2.3拓扑数据结构 73
4.2.4关系结构 73
4.3分层数据结构 74
4.3.1金字塔 74
4.3.2四叉树 75
4.3.3其他金字塔结构 76
4.4总结 77
4.5参考文献 78
第5章 图像预处理 79
5.1像素亮度变换 79
5.1.1位置相关的亮度校正 80
5.1.2灰度级变换 80
5.2几何变换 82
5.2.1像素坐标变换 83
5.2.2亮度插值 84
5.3局部预处理 86
5.3.1图像平滑 86
5.3.2边缘检测算子 92
5.3.3二阶导数过零点 96
5.3.4图像处理中的尺度 98
5.3.5Canny边缘提取 100
5.3.6参数化边缘模型 102
5.3.7多光谱图像中的边缘 103
5.3.8频域的局部预处理 103
5.3.9用局部预处理算子作线检测 108
5.3.10角点(兴趣点)检测 109
5.3.11最大稳定极值区域检测 112
5.4图像复原 114
5.4.1容易复原的退化 114
5.4.2逆滤波 115
5.4.3维纳滤波 115
5.5总结 117
5.6参考文献 118
第6章 分割I 124
6.1阈值化 124
6.1.1阈值检测方法 126
6.1.2最优阈值化 127
6.1.3多光谱阈值化 129
6.2基于边缘的分割 130
6.2.1边缘图像阈值化 131
6.2.2边缘松弛法 133
6.2.3边界跟踪 135
6.2.4作为图搜索的边缘跟踪 139
6.2.5作为动态规划的边缘跟踪 146
6.2.6Hough变换 149
6.2.7使用边界位置信息的边界检测 155
6.2.8从边界构造区域 156
6.3基于区域的分割 157
6.3.1区域归并 158
6.3.2区域分裂 160
6.3.3分裂与归并 161
6.3.4分水岭分割 163
6.3.5区域增长后处理 166
6.4匹配 166
6.4.1匹配标准 167
6.4.2匹配的控制策略 168
6.5分割的评测问题 169
6.5.1监督式评测 169
6.5.2非监督式评测 172
6.6总结 172
6.7参考文献 175
第7章 分割Ⅱ 182
7.1均值移位分割 182
7.2活动轮廓模型——蛇行 187
7.2.1经典蛇行和气球 188
7.2.2扩展 191
7.2.3梯度矢量流蛇 191
7.3几何变形模型——水平集和测地活动轮廓 194
7.4模糊连接性 200
7.5面向基于3D图的图像分割 204
7.5.1边界对的同时检测 205
7.5.2次优的表面检测 208
7.6图割分割 209
7.7最优单和多表面分割 214
7.8总结 223
7.9参考文献 224
第8章 形状表示与描述 232
8.1区域标识 234
8.2基于轮廓的形状表示与描述 236
8.2.1链码 237
8.2.2简单几何边界表示 237
8.2.3边界的傅里叶变换 239
8.2.4使用片段序列的边界描述 241
8.2.5 B样条表示 243
8.2.6其他基于轮廓的形状描述方法 245
8.2.7形状不变量 245
8.3基于区域的形状表示与描述 248
8.3.1简单的标量区域描述 248
8.3.2矩 251
8.3.3凸包 253
8.3.4基于区域骨架的图表示 257
8.3.5区域分解 259
8.3.6区域邻近图 260
8.4形状类别 261
8.5总结 261
8.6参考文献 263
第9章 物体识别 270
9.1知识表示 270
9.2统计模式识别 274
9.2.1分类原理 275
9.2.2分类器设置 276
9.2.3分类器学习 278
9.2.4支持向量机 280
9.2.5聚类分析 284
9.3神经元网络 286
9.3.1前馈网络 287
9.3.2非监督学习 288
9.3.3 Hopfield神经元网络 289
9.4句法模式识别 290
9.4.1语法与语言 291
9.4.2句法分析与句法分类器 293
9.4.3句法分类器学习与语法推导 294
9.5作为图匹配的识别 295
9.5.1图和子图的同构 296
9.5.2图的相似度 298
9.6识别中的优化技术 299
9.6.1遗传算法 300
9.6.2模拟退火 302
9.7模糊系统 303
9.7.1模糊集和模糊隶属函数 304
9.7.2模糊集运算 305
9.7.3模糊推理 306
9.7.4模糊系统设计与训练 308
9.8模式识别中的Boosting方法 309
9.9总结 311
9.10参考文献 314
第10章 图像理解 319
10.1图像理解控制策略 320
10.1.1并行和串行处理控制 320
10.1.2分层控制 321
10.1.3自底向上的控制 321
10.1.4基于模型的控制 321
10.1.5混合的控制策略 322
10.1.6非分层控制 325
10.2 RANSAC:通过随机抽样一致来拟合 326
10.3点分布模型 329
10.4活动表观模型 337
10.5图像理解中的模式识别方法 344
10.5.1基于分类的分割 344
10.5.2上下文图像分类 346
10.6 Boosted层叠分类器用于快速物体检测 349
10.7场景标注和约束传播 352
10.7.1离散松弛法 353
10.7.2概率松弛法 355
10.7.3搜索解释树 357
10.8语义图像分割和理解 357
10.8.1语义区域增长 358
10.8.2遗传图像解释 360
10.9隐马尔可夫模型 365
10.9.1应用 369
10.9.2耦合的HMM 370
10.9.3贝叶斯信念网络 371
10.10高斯混合模型和期望最大化 372
10.11总结 378
10.12参考文献 380
第11章3D视觉和几何 389
11.1 3D视觉任务 389
11.1.1 Marr理论 391
11.1.2其他视觉范畴:主动和有目的的视觉 392
11.2射影几何学基础 393
11.2.1射影空间中的点和超平面 394
11.2.2单应性 395
11.2.3根据对应点估计单应性 397
11.3单透视摄像机 400
11.3.1摄像机模型 400
11.3.2齐次坐标系中的投影和反投影 402
11.3.3从已知场景标定一个摄像机 403
11.4从多视图重建场景 403
11.4.1三角测量 403
11.4.2射影重建 404
11.4.3匹配约束 405
11.4.4光束平差法 406
11.4.5升级射影重建和自标定 407
11.5双摄像机和立体感知 408
11.5.1极线几何学——基本矩阵 408
11.5.2摄像机的相对运动——本质矩阵 410
11.5.3分解基本矩阵到摄像机矩阵 411
11.5.4从对应点估计基本矩阵 411
11.5.5双摄像机矫正结构 412
11.5.6矫正计算 414
11.6三摄像机和三视张量 415
11.6.1立体对应点算法 417
11.6.2距离图像的主动获取 421
11.7由辐射测量到3D信息 423
11.7.1由阴影到形状 423
11.7.2光度测量立体视觉 426
11.8总结 427
11.9参考文献 428
第12章 3D视觉的应用 433
12.1由X到形状 433
12.1.1由运动到形状 433
12.1.2由纹理到形状 437
12.1.3其他由X到形状的技术 439
12.2完全的3D物体 440
12.2.1 3D物体、模型以及相关问题 440
12.2.2线条标注 441
12.2.3体积表示和直接测量 443
12.2.4体积建模策略 444
12.2.5表面建模策略 446
12.2.6为获取完整3D模型的面元标注与融合 447
12.3基于3D模型的视觉 451
12.3.1一般考虑 451
12.3.2Goad算法 452
12.3.3基于模型的亮度图像曲面物体识别 455
12.3.4基于模型的距离图像识别 456
12.4 3D场景的2D视图表达 456
12.4.1观察空间 456
12.4.2多视图表达和示象图 457
12.4.3作为2D视图结构化表达的几何基元 457
12.4.4利用存储的2D视图显示3D真实世界场景 458
12.5实例研究——由未组织的2D视图集重建3D 460
12.6总结 463
12.7参考文献 464
第13章 数学形态学 470
13.1形态学基本概念 470
13.2形态学四原则 471
13.3二值膨胀和腐蚀 472
13.3.1膨胀 472
13.3.2腐蚀 474
13.3.3击中击不中变换 476
13.3.4开运算和闭运算 476
13.4灰度级膨胀和腐蚀 477
13.4.1顶面、本影、灰度级膨胀和腐蚀 477
13.4.2本影同胚定理和膨胀、腐蚀及开、闭运算的性质 479
13.4.3顶帽变换 480
13.5骨架和物体标记 481
13.5.1同伦变换 481
13.5.2骨架和最大球 481
13.5.3细化、粗化和同伦骨架 482
13.5.4熄灭函数和最终腐蚀 485
13.5.5最终腐蚀和距离函数 486
13.5.6测地变换 487
13.5.7形态学重构 488
13.6粒度测定法 489
13.7形态学分割与分水岭 491
13.7.1粒子分割、标记和分水岭 491
13.7.2二值形态学分割 491
13.7.3灰度级分割和分水岭 493
13.8总结 494
13.9参考文献 495
第14章 图像数据压缩 497
14.1图像数据性质 498
14.2图像数据压缩中的离散图像变换 498
14.3预测压缩方法 500
14.4矢量量化 502
14.5分层的和渐进的压缩方法 502
14.6压缩方法比较 503
14.7其他技术 504
14.8编码 504
14.9JPEG和MPEG图像压缩 505
14.9.1 JPEG——静态图像压缩 505
14.9.2 JPEG-2000压缩 506
14.9.3 MPEG——全运动的视频压缩 508
14.10总结 509
14.11参考文献 511
第15章 纹理 514
15.1统计纹理描述 516
15.1.1基于空间频率的方法 516
15.1.2共生矩阵 517
15.1.3边缘频率 519
15.1.4基元长度(行程) 520
15.1.5Laws纹理能量度量 521
15.1.6分形纹理描述 521
15.1.7多尺度纹理描述——小波域方法 522
15.1.8其他纹理描述的统计方法 525
15.2句法纹理描述方法 526
15.2.1形状链语法 526
15.2.2图语法 527
15.2.3分层纹理中的基元分组 528
15.3混合的纹理描述方法 530
15.4纹理识别方法的应用 531
15.5总结 531
15.6参考文献 532
第16章 运动分析 537
16.1差分运动分析方法 539
16.2光流 542
16.2.1光流计算 542
16.2.2全局和局部光流估计 544
16.2.3局部和全局相结合的光流估计 546
16.2.4运动分析中的光流 546
16.3基于兴趣点对应关系的分析 549
16.3.1兴趣点的检测 549
16.3.2兴趣点的对应关系 549
16.4特定运动模式的检测 551
16.5视频跟踪 554
16.5.1背景建模 554
16.5.2基于核函数的跟踪 558
16.5.3目标路径分析 562
16.6辅助跟踪的运动模型 566
16.6.1卡尔曼滤波器 567
16.6.2粒子滤波器 570
16.7总结 573
16.8参考文献 575
词汇 581