第1章 Markov随机场简介 1
1.1 最简单的Markov模型:Markov链 2
1.2 隐Markov模型 3
1.3 树状Markov模型 5
1.3.1 树结构的推理:置信度传播 6
1.3.2 实例:五个节点模型上的“最大-积”置信度传播 6
1.4 Markov随机场:图状Markov模型 7
1.5 隐MRF模型 9
1.5.1 实例:像素四连通图的分割 10
1.5.2 实例:图像重建 11
1.5.3 连续值MRF 11
1.5.4 条件随机场 11
1.6 推理:最大后验/边缘 12
1.6.1 Gibbs取样 12
1.6.2 均值场近似 12
1.6.3 迭代条件模态 12
1.6.4 模拟退火 13
1.6.5 环状置信度传播 13
1.7 离散模型中的MAP推理 14
1.7.1 子模伪布尔函数 14
1.7.2 采用图切割最小化子模伪布尔函数 14
1.8 图切割的多值标签求解 15
1.9 线性规划的MAP推理 16
1.1 0 Markov随机场的参数学习 17
1.1 0.1 最大似然 17
1.1 0.2 最大间隔学习 18
1.1 1符号汇编 19
第一部分MRF的MAP估计推理算法 22
第2章 基本的图切割算法 22
2.1 最小切割/最大流问题算法描述 23
2.1.1 有向图背景 23
2.1.2 最小切割/最大流问题 24
2.1.3 组合优化的标准算法 24
2.1.4 BK算法 25
2.1.5 时空效率分析 26
2.2 能量最小工具——最大流算法 27
2.2.1 参数重置和规范形式 28
2.2.2 子模 29
2.3 最小化非子模函数 30
2.3.1 顶对偶松弛特性 31
2.3.2 最大流求解顶对偶松弛:BHS算法 31
2.4 总结 33
2.5 附录:最大流的参数重置 33
第3章 移动生成算法优化多标签MRF 35
3.1 简介 35
3.2 交换和扩展算法概述 37
3.2.1 离散优化中的局部最小值 37
3.2.2 交换和扩展移动的定义 37
3.2.3 算法和特性 39
3.3 搜寻最优交换和扩展移动 39
3.4 最优特性分析 40
3.4.1 扩展算法 41
3.4.2 半度量近似 41
3.5 实验结果 42
3.5.1 图像复原 42
3.5.2 立体匹配 43
3.6 结论 44
第4章 凸性和截断凸性先验下的多标记MRF优化 45
4.1 简介 45
4.2 凸函数Ψij(i,j)优化求解 46
4.3 截断凸函数Ψij(i,j)优化求解 48
4.3.1 αβ范围移动 48
4.3.2 |α-β≤T时的αβ范围移动 49
4.3.3 泛化的αβ范围移动 49
4.4 实验结果 50
4.4.1 图像复原 50
4.4.2 图像修复 50
4.4.3 立体匹配 51
4.5 后续发展 52
第5章 环状置信度传播与均值场理论及Bethe近似 53
5.1 两种典型的MRF模型 53
5.2 均值场理论和变分方法 55
5.2.1 均值场自由能 55
5.2.2 均值场自由能和变分边界 56
5.2.3 最陡下降最小化自由能及其变种 57
5.2.4 温度和确定性退火 58
5.3 置信度传播和Bethe自由能 59
5.3.1 消息传递 60
5.3.2 Bethe自由能 60
5.3.3 对偶形式下的消息描述 61
5.4 随机推理 61
5.5 讨论 63
致谢 64
第6章 线性规划和置信度传播的变种 65
6.1 引言 65
6.1.1 能量最小化和其线性规划松弛 65
6.1.2 特殊目的的LP求解法需求 67
6.2 常用“和-积”置信度传播和线性规划 67
6.3 凸性最大-积BP 71
6.4 讨论 73
6.5 附录:执行细节 73
6.5.1 对数空间中的执行 73
6.5.2 Potts模型中高效计算消息 73
致谢 74
第二部分 包含分割的M RF应用 76
第7章 采用图切割方法的交互式前景提取 76
7.1 交互式图像分割简介 77
7.2 基本的图切割用于图像分割 78
7.3 GrabCut+方法:迭代图切割用于图像分割 79
7.3.1 GrabCut模型 80
7.3.2 优化过程 80
7.3.3 GrabCut模型特性 81
7.4 背景去除:MS Office 2010中的图像分割 82
7.4.1 初始化和边界框先验 82
7.4.2 建模用户意图 83
7.5 评价与后续工作 84
7.5.1 稳态用户输入 84
7.5.2 动态用户输入 84
7.5.3 后续工作 86
致谢 86
第8章 连续值MRF下的图像分割 87
8.1 泛化图像分割算法 87
8.2 p-画刷问题的求解 90
8.2.1 p-画刷算法的特殊情况 90
8.2.2 任意p范数的分割 91
8.3 实验 92
8.3.1 度量人工效应 92
8.3.2 近邻偏差 94
8.3.3 萎缩偏差 95
8.4 结论 96
8.5 附录:无穷范数最优定理的证明 96
致谢 97
第9章 双层结构的视频分割 98
9.1 介绍 98
9.2 概率分割模型 99
9.2.1 条件随机场能量项 99
9.2.2 时序先验项 99
9.2.3 Ising空间能量 101
9.2.4 颜色似然 101
9.2.5 运动似然 101
9.2.6 能量最小化的推理 102
9.3 实验结果 103
9.4 结论 105
致谢 105
第10章 MRF超分辨率和纹理合成 106
10.1 图像预滤波 106
10.2 未知状态的表示 107
10.3 MRF参数化 108
10.4 环状置信度传播 109
10.5 纹理合成 111
10.6 一些相关应用 113
致谢 113
第11章 MRF中能量最小方法的比较研究 114
11.1 简介 114
11.2 问题描述和实验架构 115
11.2.1 能量模型 115
11.2.2 方法评估和软件界面 115
11.3 能量最小化算法 116
11.3.1 迭代条件模态 116
11.3.2 基于图切割的移动决策方法 116
11.3.3 最大-积环状置信度传播 116
11.3.4 树状重置权重消息传递 117
11.4 基准问题 117
11.4.1 立体匹配 117
11.4.2 照片蒙太奇 118
11.4.3 二值图像分割 119
11.4.4 图像去噪与修复 119
11.5 实验结果 119
11.6 实验对比:遮挡和无遮挡的立体视觉 123
11.7 结论 125
第三部分 深入讨论:推理、参数学习和连续模型 128
第12章 凸松弛技术在分割、立体视觉和多视角重建中的应用 128
12.1 变分方法、偏微分方程和凸性 128
12.2 图像分割和最小划分 129
12.2.1 典型的变分方法 129
12.2.2 一般的变分公式 129
12.2.3 凸表示 130
12.2.4 凸松弛 131
12.2.5 分割实验结果 132
12.3 立体重建 132
12.4 多视角重构 134
12.5 总结和结论 137
第13章 连续值Markov随机场中的参数学习 138
13.1 计算机视觉中的连续MRF 138
13.2 基本公式表达 138
13.3 连续模型中的参数估计 139
13.4 最大似然参数估计 139
13.4.1 MRF中基于损失的参数估计 140
13.4.2 参数估计的执行过程 141
13.5 高斯MRF模型中基于损失的参数估计 141
13.5.1 实例应用:高斯条件随机场的图像去噪 141
13.5.2 GMRF模型的去噪 142
13.5.3 设计和学习权重函数用于去噪 142
13.5.4 去噪执行效果 144
13.6 非高斯模型下的基于损失的学习算法 145
13.6.1 计算梯度的完整步骤 146
13.6.2 相关工作 146
13.6.3 评价 146
13.7 结论 146
致谢 147
第14章 连续隐变量的消息传递 148
14.1 连续适应性离散化过程 148
14.2 离散化因子图 149
14.3 离散化算法 150
14.4 CAD-MP实例 152
14.5 CAD-MP的相关工作 153
14.6 粒子网络的置信度传播 154
14.7 重要性函数选择 155
14.8 无参置信度传播 155
14.9 无参置信度传播实例 157
14.1 0讨论 159
致谢 159
第15章 采用图切割学习最大间隔随机场 160
15.1 随机场学习概述 160
15.1.1 一种基于能量的学习算法 162
15.1.2 大间隔学习的目标函数 163
15.1.3 一种有效的学习算法 163
15.1.4 图像分割中的参数学习 164
15.2 目标函数 165
15.2.1 重放缩间隔 165
15.2.2 重放缩松弛 166
15.2.3 能量损失最小值 166
15.3 实验 166
15.3.1 提炼分割 167
15.3.2 几何标记 168
15.4 讨论和结论 169
致谢 170
第16章 MAP估计中的凸松弛分析 171
16.1 预备知识 172
16.2 MAP估计及其凸松弛 173
16.2.1 整数规划形式 173
16.2.2 线性规划松弛 173
16.2.3 二次规划松弛 174
16.2.4 半定规划松弛 174
16.2.5 二阶锥形松弛规划 175
16.3 松弛对比 176
16.3.1 比较标准 176
16.3.2 LP-S与SOCP-MS对比 177
16.3.3 QP-RL与SOCP-MS对比 178
16.3.4 树状和环状结构的SOCP松弛 179
16.4 讨论 179
致谢 180
第17章 快速原始-对偶线性规划的MAP推理 181
17.1 介绍 181
17.2 原始-对偶框架 182
17.3 MRF中的原始-对偶框架 184
17.3.1 类别Ⅰ的原始-对偶方法 186
17.3.2 类别Ⅱ的原始-对偶方法 187
17.4 最大流求解MRF中的快速原始-对偶框架 188
17.5 原始-对偶算法的最优特性 189
17.6 原始-对偶算法的计算效率 190
17.6.1 简单的MRF 190
17.6.2 动态MRF 191
17.7 结论 193
致谢 193
第18章 扩展标记空间中的MRF融合移动优化 194
18.1 介绍 194
18.2 融合移动算法简介 195
18.2.1 二值标记MRF的组合优化 195
18.2.2 融合移动 195
18.2.3 非子模处理 196
18.3 与其他类融合方法的关系 197
18.4 应用 198
18.4.1 采用融合移动并行α扩展 198
18.4.2 光流估计的融合流 199
18.5 讨论 202
第四部分 高阶MRF和全局约束 204
第19章 专家场 204
19.1 介绍 204
19.2 专家场的基本描述 206
19.2.1 对比差异学习 207
19.2.2 推理 208
19.3 实例应用 208
19.3.1 图像去噪 209
19.3.2 图像修复 209
19.4 实验评价 209
19.4.1 去噪实验 210
19.4.2 修复实验 210
19.5 拓展及其他应用 211
19.6 讨论 212
19.7 总结和结论 212
致谢 213
第20章 采用高阶势函数强化标记一致性 214
20.1 介绍 214
20.1.1 目标分割与识别 214
20.1.2 高阶CRF 215
20.2 二元CRF的目标分割 215
20.3 融合高阶势函数 216
20.3.1 基于区域的一致性势函数 217
20.3.2 质量敏感一致性势函数 217
20.3.3 势函数鲁棒化 218
20.3.4 生成多个分割结果 219
20.4 高阶CRF的推理 219
20.5 鲁棒高阶势函数 220
20.5.1 近似凹性一致势函数 221
20.5.2 鲁棒高阶势函数的泛化形式 222
20.6 高阶移动函数的转换 222
20.7 实验 223
20.7.1 多次分割效应 224
20.7.2 计算精确度 225
20.8 结论 225
第21章 含非局部参数Markov随机场的确切优化 226
21.1 介绍 226
21.2 相关工作 227
21.3 最优框架 227
21.3.1 能量和下界 227
21.3.2 分支和界定优化 228
21.4 二值图像分割 229
21.4.1 形状先验下的分割 230
21.4.2 灰度先验下的分割 232
21.5 基于部分的目标检测 233
21.6 讨论 236
第22章 含连通性先验图切割下的图像分割 237
22.1 介绍 237
22.2 问题描述 239
22.3 算法 240
22.3.1 Dijkstra GC:融合Dijkstra和图切割 240
22.3.2 问题分解方法 243
22.4 实验结果 244
22.4.1 交互式分割的Dijkstra GC 244
22.4.2 Dijkstra GC的最优性 246
第五部分F的高级应用 248
第23章 对称立体匹配下的遮挡求解 248
23.1 介绍 248
23.1.1 已有工作 248
23.1.2 可视性约束 249
23.2 对称立体模型 250
23.2.1 数据项 250
23.2.2 平滑项 251
23.2.3 可视性项 251
23.3 置信度传播下的迭代优化 251
23.4 软约束下的分割 253
23.5 实验结果 254
23.6 结论 256
第24章 转向随机场的图像复原 257
24.1 介绍 257
24.2 相关工作 258
24.3 转向滤波响应和统计特性 259
24.4 转向随机场模型 260
24.4.1 基本模型 260
24.4.2 实际考虑 261
24.4.3 学习 262
24.5 图像复原应用 262
24.6 总结与展望 264
致谢 264
第25章 Markov随机场的目标检测 265
25.1 布局一致随机场模型 266
25.1.1 布局一致的二元势函数 267
25.1.2 实例势函数 268
25.2 推理 269
25.2.1 扩展移动算法 269
25.2.2 推理目标实例 270
25.3 学习 270
25.3.1 一元势函数 270
25.3.2 二元势函数 271
25.3.3 实例势函数 272
25.4 评价 272
25.4.1 UIUC汽车数据库 272
25.4.2 人脸数据库 273
25.4.3 多类情况 274
25.4.4 多视角 274
25.5 结论 275
第26章 SIFT流:多场景稠密匹配及其应用 276
26.1 介绍 276
26.2 SIFT流算法 277
26.2.1 稠密SIFT描述子和可视化 277
26.2.2 匹配的目标函数 278
26.2.3 SIFT流的邻域 279
26.3 稠密场景对应匹配实验 279
26.4 大规模数据集中基于对齐框架的图像分析与合成 282
26.4.1 从单幅图像中预测运动场 282
26.4.2 人脸识别 283
26.5 结论 284
致谢 285
第27章 展开镶嵌图像:视频中形变表面建模 286
27.1 介绍 286
27.2 展开的镶嵌模型 287
27.2.1 离散能量形式 289
27.2.2 数据代价 289
27.2.3 约束 290
27.2.4 映射平滑 290
27.2.5 可视平滑 291
27.2.6 纹理先验 291
27.3 最小化能量 291
27.3.1 寻找w:重参数化和嵌入过程 291
27.3.2 最小化w:稠密映射 292
27.3.3 最小化w和b:含遮挡的稠密映射 292
27.3.4 最小化C:拼接 293
27.3.5 过程总汇 293
27.4 结果 293
27.5 讨论 294
致谢 295