目次 1
第一章 计算机视觉的三十年 1
1.1 引言 1
1.2 计算机视觉的基本概念 1
1.2.1 图像增强和恢复 2
1.2.2 图像数据编码和传输 2
1.2.3 图像分析和识别 3
1.2.4 图像代数 12
1.3 视觉计算理论和三维视觉 16
1.3.1 从立体视觉求深度 18
1.3.2 从运动求结构 19
1.3.3 从视觉流(optical flow)求结构 21
1.3.4 从阴影求形状 23
1.3.5 从纹理和表面轮廓求形状 25
1.3.6 由线条图求形状 27
1.3.7 由遮挡轮廓求形状 28
1.3.8 由空间编码求形状 29
1.3.9 结束语 30
1.4 视觉信息系统 30
1.4.1 认知学基础 31
1.4.2 基于模型的三维物体识别 32
1.4.3 空间信息的数据模式 33
1.4.4 空间信息系统的物理数据结构 35
1.4.5 使用框架系统的知识化界面 35
1.4.6 用于建立区域规划辅助决策系统的知识表达语言IDL 36
1.4.7 空间信息系统的可视查询语言 36
1.5 计算机图形学 38
1.5.1 三维物体模型 38
1.5.2 真实感景物的生成 39
1.5.3 光源模型和光照模型 39
1.5.4 光线跟踪算法产生三维真实感景物 40
1.5.5 分维几何 42
1.6 用于计算机视觉的并行体系结构 44
1.6.1 视觉计算机的结构要求 45
1.6.2 并行结构分类 47
第二章 图像数据的统计模型 52
2.1 晶格系统的空间作用与统计分析 52
2.2 用条件概率方法表达空间过程 53
2.3 马尔科夫场和Hammersley-clifford定理 54
2.4 与指数类型相关的一些空间组织 56
2.4.1 自模型 56
2.4.2 一些特殊的自模型 57
2.5 一些二维的空间组织及它们的应用 59
2.5.1 有限晶格组织 59
2.5.2 特殊的有限晶格组织 60
2.5.3 非晶格系统 61
2.5.4 联立自回归组织 61
2.5.5 在无限晶格上的自正态过程 62
2.6 晶格系统的统计分析 63
2.6.1 矩形晶格上的编码方法 63
2.6.3 自正态系统的最大似然估计 64
2.6.2 矩形晶格上的单向近似 64
2.7 随机松弛、Gibbs分布与贝叶斯最大后验图像恢复 66
2.7.1 退化图像模型 67
2.7.2 图和邻域 68
2.7.3 马尔可夫随机场和Gibbs分布 68
2.7.4 GIBBS抽样 72
2.7.5 图像恢复的例子 73
2.8 结束语 74
第三章 视觉中的近似理论和正则化理论 75
3.1 引言 75
3.2 学习和近似网络 76
3.2.1 最佳近似特性 77
3.2.2 网络与近似方法 78
3.3 超表面重建学习 79
3.3.1 近似、正则化和归一化样条 79
3.3.2 用于学习的正则化技术 79
3.3.3 学习、贝叶斯理论和最小长度原理 80
3.3.4 由超表面重建到网络 80
3.4 正则化理论与正则化网络 80
3.4.1 正则化理论 81
3.4.2 正则化网络 84
3.4.3 网络与最佳近似 85
3.5.1 移动中心:对正则化解的近似 87
3.5 正则化方法的推广 87
3.5.2 不同类型的根基函数与多尺度 88
3.5.3 加权范数与正则化 89
3.5.4 用不可靠样本学习 89
3.5.5 怎样学习中心的位置和范数权重 90
3.5.6 一个实际算法 92
3.6 高斯基函数与科学—假说神经生物 92
3.6.1 可分解根基函数 92
3.6.2 计算网络和生理学预言 93
3.8 结论 94
3.7.3 理解和发动机任务学习 94
3.8.1 正则化网络是怎样真正工作的 94
3.7.1 由其透视图识别三维物体 94
3.7 一些应用 94
3.7.2 学习动力学系统 94
3.8.2 与其它方法的联系 95
3.8.3 网络与学习:维数问题 96
3.8.4 总结 96
3.9 计算视觉与正则化理论 96
附录A 定义与基本原理 101
附录B 高斯网络与Stone定理 101
附录C 正则化网络可任意地近似平滑函数 103
附录D 根基函数:综述 104
4.1.1 图像构成模型 107
第四章 三维景物模型 107
4.1 景物结构模型 107
4.1.2 特殊模型 108
4.1.3 部分和过程模型 109
4.2 自然形态的表达 110
4.2.1 生物形态 112
4.2.2 复杂的非生物形态 112
4.2.3 小结 114
4.3 初级感知:识别模型 115
4.3.2 把视觉看作优化问题 116
4.3.1 识别超二次曲面模,型基元 116
4.3.3 学习物体模型 119
4.3.4 识别分形表面 119
4.3.5 分形尺寸的度量 122
4.3.6 超定束测试该模型的可用性 123
4.4 小结 123
第五章 利用单个二维灰度图像进行三维物体的识别 125
5.1 引言 125
5.2 深度重建在人类视觉中的地位 126
5.3 空间对应的解决 127
5.3.1 牛顿方法的运用 128
5.3.2 利用线—线对应关系 131
5.3.3 在匹配中使用参数确定 132
5.3.4 扩展匹配的初始集 133
5.4 感知组织 133
5.4.1 分组操作的导出 134
5.4.2 基于邻近的分组 135
5.4.3 基于平行的分组 136
5.4.4 基于共线的分组 136
5.4.6 连结点到直线段的分割 137
5.4.5 分组操作的实现 137
5.5 SCERP视觉系统 138
5.5.1 模型匹配 140
5.6 进一步的研究方向 141
5.7 结论 143
第六章 使用变换网络的形状理论 144
6.1 引言 144
6.1.1 物体为中心的坐标系 145
6.1.2 从视觉输入计算以物体为中心的坐标系 146
6.1.3 用任务坐标系计算目标变换 147
6.2.1 值单元原理 149
6.1.4 理论基础和概述 149
6.2 背景知识参数网络分层体系 149
6.2.2 用值单元计算 150
6.2.3 连续值的离散过程 152
6.2.4 内插和最小化 153
6.2.5 内插值和Hough变换 153
6.2.6 实际设计 154
6.2.7 多面体限制 155
6.2.8 建立二维线段 156
6.2.9 建立三维线框模型 157
6.2.10 三维视网膜数据与原型的匹配 159
6.3 网络和高层控制 159
6.4 一个初步的试验 160
6.5 结论 161
第七章 计算机视觉的神经网络方法 164
7.1 表面知觉的模型问题 164
7.1.1 表面理解理论解释的必要条件 164
7.1.2 定向反差检测器 166
7.1.3 OC滤波器和短范围竞争阶段 166
7.1.4 大范围合作:边界完成 167
7.1.5 利用合作竞争反馈网络的边界选择:CC环 168
7.1.6 从模拟反差到数字结构 170
7.1.7 利用可视反差的识别 171
7.2 神经识别机(Neocognitron):一个能进行视觉模式识别的分层神经网络 172
7.2.1 网络结构 173
7.2.2 网络的自组织 175
7.2.3 手写体数字的识别 178
7.2.4 讨论 184
7.3 神经网络的自组织图 185
7.4 总结 190