第1章 引言 1
目录 1
1.1 总结 5
1.2习题 5
1.3参考文献 6
第2章数字图像及其性质 7
2.1基本概念 7
2.1.1 图像函数 7
2.1.3傅立叶变换 9
2.1.2狄拉克(Dirac)分布和卷积 9
2.1.4作为随机过程的图像 10
2.1.5作为线性系统的图像 12
2.2图像数字化 12
2.2.1采样 12
2.2.2量化 15
2.2.3彩色图像 16
2.3数字图像性质 18
2.3.1 数字图像的度量和拓扑性质 18
2.3.2直方图 21
2.3.3 图像的视觉感知 22
2.3.4图像品质 23
2.3.5图像中的噪声 23
2.4总结 25
2.5习题 25
2.6参考文献 27
第3章图像分析的数据结构 28
3.1图像数据表示的层次 28
3.2.1矩阵 29
3.2传统图像数据结构 29
3.2.2链 30
3.2.3拓扑数据结构 31
3.2.4关系结构 32
3.3分层数据结构 32
3.3.1金字塔 33
3.3.2四叉树 33
3.3.3其他金字塔结构 35
3.4 总结 35
3.5 习题 36
3.6参考文献 37
第4章图像预处理 39
4.1像素亮度变换 39
4.1.1 与位置相关的亮度校正 40
4.1.2灰度级变换 40
4.2几何变换 42
4.2.1像素坐标变换 43
4.2.2亮度插值 44
4.3局部预处理 46
4.3.1 图像平滑 47
4.3.2边缘检测算子 52
4.3.3二阶导数过零点 55
4.3.4 图像处理中的尺度 59
4.3.5 Canny边缘提取 60
4.3.6参数化边缘模型 62
4.3.7 多光谱图像中的边缘 62
4.3.8其他局部预处理算子 63
4.3.9 自适应邻域性预处理 65
4.4.1容易复原的退化 69
4.4图像复原 69
4.4.2逆滤波 70
4.4.3维纳滤波 70
4.5 总结 72
4.6习题 73
4.7参考文献 78
第5章分割 83
5.1 阈值化 83
5.1.1 阈值检测方法 85
5.1.2最优阈值化 87
5.1.3多光谱阈值化 89
5.1.4分层数据结构下的阈值化 90
5.2基于边缘的分割 91
5.2.1边缘图像阈值化 91
5.2.2边缘松弛法 93
5.2.3边界跟踪 96
5.2.4作为图搜索的边缘跟踪 100
5.2.5作为动态规划的边缘跟踪 107
5.2.6Hough变换 110
5.2.7使用边界位置信息的边界检测 116
5.2.8从边界构造区域 117
5.3基于区域的分割 118
5.3.1 区域归并 119
5.3.2区域分裂 121
5.3.3分裂与归并 122
5.3.4分水岭分割 125
5.3.5 区域增长后处理 127
5.4匹配 128
5.4.1 匹配标准 128
5.5.1边界对的同时检测 130
5.4.2匹配的控制策略 130
5.5高级最优边界与表面检测方法 130
5.5.2表面检测 133
5.6 总结 138
5.7习题 140
5.8参考文献 144
第6章形状表示与描述 156
6.1 区域标识 159
6.2.2简单几何边界表示 161
6.2基于轮廓的形状表示与描述 161
6.2.1链码 161
6.2.3边界的傅立叶变换 164
6.2.4使用片段序列的边界描述 165
6.2.5 B样条表示 168
6.2.6其他基于轮廓的形状描述方法 169
6.2.7形状不变量 170
6.3基于区域的形状表示与描述 173
6.3.1 简单的标量区域描述 174
6.3.2矩 177
6.3.3凸包 179
6.3.4基于区域骨架的图表示 183
6.3.5区域分解 185
6.3.6区域邻近图 186
6.4形状类别 187
6.5总结 187
6.6习题 188
6.7参考文献 191
第7章物体识别 200
7.1知识表示 201
7.2统计模式识别 204
7.2.1分类原理 205
7.2.2分类器设置 206
7.2.3分类器学习 208
7.2.4聚类分析 210
7.3神经元网络 211
7.3.1 前馈网络 213
7.3.2非监督学习 214
7.3.3 Hopfield神经元网络 215
7.4句法模式识别 216
7.4.1语法与语言 217
7.4.2句法分析与句法分类器 218
7.4.3句法分类器学习与语法推导 220
7.5作为图匹配的识别 221
7.5.1 图和子图的同构 221
7.5.2图的相似度 224
7.6识别中的优化技术 225
7.6.1遗传算法 225
7.6.2模拟退火 227
7.7.1模糊集合和模糊隶属函数 229
7.7模糊系统 229
7.7.2模糊集合运算 231
7.7.3模糊推理 231
7.7.4模糊系统设计与训练 234
7.8总结 234
7.9习题 236
7.10参考文献 241
第8章图像理解 249
8.1.1并行和串行处理控制 250
8.1图像理解控制策略 250
8.1.2分层控制 251
8.1.3 自底向上的控制策略 251
8.1.4基于模型的控制策略 251
8.1.5混合的控制策略 252
8.1.6非分层控制 255
8.2活动轮廓模型——蛇行 257
8.3点分布模型 261
8.4图像理解中的模式识别方法 268
8.5.1离散松弛法 273
8.5场景标注和约束传播 273
8.5.2概率松弛法 275
8.5.3搜索解释树 277
8.6语义图像分割和理解 278
8.6.1语义区域增长 279
8.6.2遗传图像解释 280
8.7隐马尔可夫模型 286
8.8总结 290
8.9习题 291
8.10参考文献 293
第9章3D视觉、几何和辐射学 305
9.1 3D视觉任务 305
9.1.1Marr理论 307
9.1.2其他视觉范畴:主动和有目的的视觉 308
9.2 3D视觉的几何 309
9.2.1射影几何学基础 309
9.2.2单透视摄像机 310
9.2.3单摄像机标定概述 313
9.2.4从已知场景标定一个摄像机 314
9.2.5双摄像机和立体感知 316
9.2.6双摄像机几何学——基本矩阵 318
9.2.7摄像机的相对运动——本质矩阵 319
9.2.8从图像对应点估计基本矩阵 320
9.2.9视觉中的极线几何的应用 321
9.2.10三摄像机和更多摄像机 325
9.2.11 立体对应点算法 328
9.2.12距离图像的主动获取 333
9.3.1 在确定灰度量级时的辐射学考虑 335
9.3辐射学与3D视觉 335
9.3.2表面反射 337
9.3.3由阴影到形状 340
9.3.4光度测量立体视觉 342
9.4总结 343
9.5 习题 344
9.6参考文献 345
第10章3D视觉的应用 350
10.1 由X到形状 350
10.1.1由运动到形状 350
10.1.2由纹理到形状 354
10.1.3其他由X到形状的技术 355
10.2完全的3D物体 357
10.2.1 3D物体、模型以及相关问题 357
10.2.2线条标注 358
10.2.3体积表示和直接测量 360
10.2.4体积建模策略 361
10.2.5表面建模策略 362
10.2.6为获取完整3D模型的面元标注与融合 364
10.3.2Goad算法 369
10.3基于3D模型的视觉 369
10.3.1一般考虑 369
10.3.3基于模型的亮度图像曲面物体识别 372
10.3.4基于模型的距离图像识别 373
10.4 3D场景的2D视图表达 373
10.4.1观察空间 373
10.4.2 多视图表达和示象图 374
10.4.3作为2D视图结构化表达的几何基元 374
10.4.4利用存储的2D视图显示3D真实世界场景 375
10.5总结 378
10.6习题 379
10.7参考文献 379
第11章数学形态学 385
11.1形态学基本概念 385
11.2形态学四原则 386
11.3二值膨胀和腐蚀 387
11.3.1 膨胀 387
11.3.2腐蚀 389
11.3.4开运算和闭运算 391
11.3.3 击中击不中变换 391
11.4灰度级膨胀和腐蚀 392
11.4.1 顶面、本影和灰度级膨胀和腐蚀 392
11.4.2本影同胚定理和膨胀、腐蚀及开、闭运算的性质 395
11.4.3顶帽变换 395
11.5骨架和物体标记 396
11.5.1 同伦变换 396
11.5.2骨架和最大球 397
11.5.3细化、粗化和同伦骨架 398
11.5.4熄灭函数和最终腐蚀 400
11.5.5最终腐蚀和距离函数 402
11.5.6测地变换 403
11.5.7形态学重构 404
11.6粒度测定法 405
11.7形态学分割与分水岭 407
11.7.1 粒子分割、标记和分水岭 407
11.7.2二值形态学分割 408
11.7.3灰度级分割和分水岭 409
11.8 总结 410
11.9习题 411
11.10参考文献 412
第12章线性离散图像变换 414
12.1基本理论 414
12.2傅立叶变换 415
12.3哈达马变换 417
12.4离散余弦变换 417
12.5小波 418
12.6其他正交图像变换 419
12.7离散图像变换的应用 420
12.8总结 425
12.9习题 426
12.10参考文献 427
第13章图像数据压缩 429
13.1图像数据性质 430
13.2图像数据压缩中的离散图像变换 430
13.3预测压缩方法 432
13.4矢量量化 434
13.5分层的和渐进的压缩方法 434
13.6压缩方法比较 435
13.7其他技术 436
13.8编码 436
13.9JPEG和MPEG图像压缩 437
13.9.1 JPEG——静态图像压缩 437
13.9.2 MPEG——全运动的视频压缩 438
13.10总结 439
13.11习题 440
13.12参考文献 442
第14章纹理 447
14.1.1基于空间频率的方法 448
14.1统计纹理描述 448
14.1.2共生矩阵 449
14.1.3边缘频率 451
14.1.4基元长度(行程) 452
14.1.5Laws的纹理能量度量 452
14.1.6分形纹理描述 453
14.1.7其他纹理描述的统计方法 454
14.2句法纹理描述方法 455
14.2.1形状链语法 456
14.2.2图语法 457
14.2.3分层纹理中的基元分组 458
14.3混合的纹理描述方法 459
14.4纹理识别方法的应用 460
14.5总结 460
14.6习题 461
14.7参考文献 463
第15章运动分析 469
15.1差分运动分析方法 471
15.2光流 473
15.2.1光流计算 474
15.2.2全局和局部光流估计 476
15.2.3光流计算方法 477
15.2.4运动分析中的光流 478
15.3基于兴趣点对应关系的分析 480
15.3.1兴趣点的检测 480
15.3.2兴趣点的对应关系 481
15.3.3物体跟踪 482
15.4卡尔曼滤波 487
15.5总结 489
15.6习题 491
15.7参考文献 492
第16章案例研究 499
16.1光学音乐识别系统 499
16.2心脏病学中的自动图像分析 502
16.2.1冠状血管造影的鲁棒分析 504
16.2.2基于知识的脉管内超声分析 506
16.3 自动气道树识别 510
16.4被动监视 514
16.5参考文献 518
术语表 523