第一篇 基础知识 3
第1章 数字图像 3
1.1 图像与视频 3
1.2 数字图像的特点 4
1.2.1 图像数据的海量性 4
1.2.2 图像的压缩格式具有普遍性 5
1.2.3 图像的内容表现具有非结构性 6
1.2.4 应用环境的多元化 6
1.3 图像的彩色空间 7
1.3.1 彩色空间的视觉属性 7
1.3.2 RGB彩色空间 7
1.3.3 YCbCr彩色空间 8
1.4 视频格式 9
1.5 感兴趣区的人眼视觉系统特性 10
1.5.1 视觉感兴趣区 10
1.5.2 视觉掩盖效应 11
1.6 图像质量的评价 15
1.6.1 概述 15
1.6.2 客观质量的评价 16
1.6.3 主观质量的评价 16
1.6.4 感兴趣区质量评价 17
1.6.5 感兴趣区质量评价的实验结果 19
1.7 讨论 21
参考文献 21
第2章 图像压缩编码技术的发展 23
2.1 概述 23
2.2 熵编码 24
2.3 传统的图像/视频编码技术 25
2.3.1 预测编码 25
2.3.2 变换编码 26
2.3.3 矢量量化 28
2.4 新型图像/视频编码技术 28
2.4.1 第二代图像编码方法 29
2.4.2 分形编码 29
2.4.3 模型编码 30
2.4.4 小波编码 31
2.5 图像/视频编码标准 32
2.5.1 静止图像编码的标准 35
2.5.2 视频编码标准 35
2.6 JPEG2000标准 40
2.6.1 JPEG2000体系结构与关键技术 40
2.6.2 JPEG2000的主要特点与性能描述 45
2.7 讨论 46
参考文献 49
第3章 基于内容的图像检索技术 52
3.1 概述 52
3.2 图像的内容特征 54
3.2.1 颜色特征 55
3.2.2 纹理特征 57
3.2.3 轮廓特征 60
3.2.4 形状特征 60
3.2.5 对象特征 61
3.2.6 空间特征 63
3.2.7 字符特征 64
3.2.8 语义特征 64
3.2.9 图像的语义层次模型 66
3.3 图像相似度计算 67
3.3.1 距离度量 67
3.3.2 相关计算 68
3.3.3 关联系数计算 69
3.3.4 多特征相似度计算 70
3.3.5 具有光照不变性的图像检索 70
3.4 人机接口及相关反馈 71
3.4.1 友好的人机交互接口 71
3.4.2 相关反馈的新进展 74
3.5 图像的检索 76
3.5.1 低层视觉特征 76
3.5.2 局部图像 76
3.5.3 自定义特征检索 77
3.5.4 示例图与草图检索 77
3.5.5 浏览检索 77
3.6 图像检索系统 78
3.7 图像检索性能的评价 79
3.8 讨论 80
参考文献 82
第二篇 基于视觉感知的个性化图像检索第4章 视觉注意机制及注意模型 82
4.1 概述 89
4.2 人眼视觉系统的生理特性 90
4.2.1 视觉感官 92
4.2.2 视觉通路 93
4.2.3 视觉中枢 94
4.2.4 视觉感知 97
4.3 视觉注意机制 98
4.3.1 What和Where视觉通路 98
4.3.2 预注意和注意阶段 99
4.3.3 自底向上和自顶向下的注意模式 99
4.3.4 选择性注意机制 100
4.3.5 注意焦点的选择与转移 102
4.4 视觉注意模型 102
4.4.1 基于空间的注意模型 103
4.4.2 基于特征的注意模型 111
4.4.3 基于空间和特征整合的注意模型 112
4.4.4 基于对象的注意模型 112
4.5 讨论 113
参考文献 114
第5章 基于视觉注意模型的感兴趣区检测 114
5.1 概述 118
5.2 感兴趣区检测的研究进展 119
5.3 一种基于改进Itti模型与进化规划的感兴趣区检测方法 121
5.3.1 视觉显著度量 122
5.3.2 注意焦点的选择与转移 124
5.3.3 感兴趣区的生成 126
5.3.4 一种基于改进Itti模型与进化规划的感兴趣区检测方法的实验 128
5.4 基于相似距离的Top-Down模型的初步研究 135
5.4.1 基于相似距离的Top-Down模型结构 135
5.4.2 相似区域的判定方法 136
5.4.3 基于相似距离的视觉期望 137
5.4.4 基于相似距离的Top-Down模型的初步实验 138
5.5 讨论 139
参考文献 140
第6章 视点跟踪技术 142
6.1 概述 142
6.2 视点跟踪技术的研究进展 143
6.2.1 人眼的运动特性 143
6.2.2 视点跟踪设备 144
6.2.3 人眼检测与定位 145
6.2.4 视点跟踪技术分类 147
6.3 改造的视点跟踪设备 150
6.3.1 视点跟踪设备的选择及参数设置 150
6.3.2 视点跟踪设备的改造方案 154
6.3.3 方案选择与对比 157
6.4 基于Gabor变换的人眼定位方法 157
6.4.1 归一化处理 158
6.4.2 Gabor小波变换 159
6.4.3 投影分析 160
6.4.4 基于Gabor变换的人眼定位方法的实验 161
6.5 一种基于双阈值的低复杂度视点跟踪方法 163
6.5.1 双阈值人眼定位算法 163
6.5.2 双阈值人眼定位算法的实验 166
6.5.3 基于几何映射的视点跟踪方法 167
6.5.4 一种基于双阈值的低复杂度视点跟踪方法的实验 168
6.6 一种基于Web Camera的自适应模板视点跟踪方法 169
6.6.1 自适应模板人眼定位算法 169
6.6.2 自适应模板人眼定位算法的实验 171
6.6.3 基于神经网络法的视点跟踪方法 172
6.6.4 一种基于Web Camera的自适应模板视点跟踪方法的实验 174
6.7 讨论 175
参考文献 176
第7章 客观化的视觉感知技术 179
7.1 概述 179
7.2 客观化的视觉感知信息 180
7.3 基于视觉感知的感兴趣区检测 181
7.3.1 注视点分布图 181
7.3.2 注视兴趣度 183
7.3.3 基于视觉感知的感兴趣区 184
7.4 基于视觉感知的感兴趣区检测实验平台 186
7.4.1 实验平台 186
7.4.2 实验结果 188
7.5 讨论 198
参考文献 199
第8章 个性化图像检索技术 200
8.1 概述 200
8.2 图像搜索引擎 202
8.3 用户兴趣模型 205
8.3.1 Agent推理机 205
8.3.2 个性化文件 209
8.3.3 用户兴趣模型的更新 213
8.4 基于规则的个性化推荐 214
8.5 基于内容的个性化推荐 218
8.5.1 概述 218
8.5.2 潜在变量分析 219
8.5.3 广义概率主分量分析模型 221
8.6 协作过滤的个性化推荐 224
8.6.1 概述 224
8.6.2 基于记忆的协作过滤 225
8.6.3 基于模型的协作过滤 229
8.6.4 基于协作过滤的图像检索 230
8.7 混合过滤的个性化推荐 233
8.8 个性化推荐系统的评价 235
8.9 相关反馈技术 235
8.10 讨论 237
参考文献 238
第9章 应用于个性化图像检索的用户兴趣模型的构建 238
9.1 概述 242
9.2 用户兴趣模型描述 243
9.2.1 用户兴趣的表示方式 243
9.2.2 用户兴趣模型的分类 244
9.2.3 用户兴趣模型的构建方法 245
9.2.4 用户兴趣模型的框图 246
9.3 用户短期兴趣的获取 247
9.3.1 短期视觉特征 248
9.3.2 短期视觉特征实验结果 253
9.3.3 短期语义特征 257
9.3.4 短期语义特征实验结果 262
9.4 用户长期兴趣的获取 263
9.4.1 推理机的设计与实现 264
9.4.2 长期视觉特征 265
9.4.3 长期视觉特征实验结果 266
9.4.4 长期语义特征 270
9.4.5 长期语义特征实验结果 273
9.5 基于用户兴趣模型的个性化图像检索系统 273
9.5.1 个性化图像检索系统组成 273
9.5.2 个性化图像检索实验结果与分析 274
9.6 讨论 281
参考文献 282
第三篇 基于压缩域的图像处理 287
第10章 压缩域图像处理技术综述 287
10.1 概述 287
10.2 压缩域图像处理系统的构成 288
10.2.1 基于压缩域的图像检索系统框图 289
10.2.2 压缩域处理可操作位置 289
10.3 压缩域图像处理的研究方法 290
10.3.1 寻求对等操作 291
10.3.2 寻求特有操作 291
10.4 压缩域图像检索技术的研究进展 292
10.4.1 变换压缩域检索技术 292
10.4.2 空间压缩域检索技术 298
10.4.3 混合压缩域检索技术 299
参考文献 300
第11章 压缩域纹理图像分类 305
11.1 概述 305
11.2 基于DCT压缩域区域能量方向性的纹理图像分类 306
11.2.1 基于DCT编码的基本框图 306
11.2.2 DCT域区域能量的方向性 307
11.2.3 基于能量方向性的纹理图像分类算法设计 309
11.2.4 基于DCT压缩域区域能量方向性的纹理图像分类算法实验 310
11.3 基于DCT压缩域的具有旋转不变性的纹理图像分类 312
11.3.1 DCT域的多分辨率特性 312
11.3.2 具有抗旋转性的纹理图像分类方法 314
11.3.3 基于DCT压缩域的具有旋转不变性的纹理图像分类算法实验 315
11.4 基于小波压缩域纹理图像分类 317
11.4.1 基于小波的纹理分析方法的发展 317
11.4.2 基于子带间相关性纹理特征提取 318
11.4.3 基于小波压缩域纹理图像分类算法 321
11.4.4 基于小波压缩域纹理图像分类算法实验 321
11.5 讨论 323
参考文献 324
第12章 DCT压缩域基于轮廓特征的图像检索 324
12.1 概述 327
12.2 基于图像检索的连通直方图方法 328
12.2.1 图像的连通直方图 328
12.2.2 基于连通直方图的图像检索 330
12.2.3 基于连通直方图的图像检索的实验 331
12.3 DCT压缩域基于轮廓特征的图像检索方法 333
12.3.1 重组DCT系数 334
12.3.2 提取图像的轮廓 334
12.3.3 基于轮廓的连通直方图 336
12.3.4 DCT压缩域基于轮廓特征的图像检索流程 337
12.3.5 DCT压缩域基于轮廓特征的图像检索的实验 337
12.4 讨论 340
参考文献 340
第13章 压缩域字符定位 341
13.1 概述 341
13.2 DCT压缩域的字符定位方法 343
13.2.1 DCT压缩域中字符特征的提取 343
13.2.2 DCT压缩域的字符定位算法 344
13.2.3 DCT压缩域字符定位算法的实验 345
13.3 基于加权频率的DCT压缩域的字符定位方法 347
13.3.1 DCT压缩域字符区新特征——加权频率 347
13.3.2 基于加权频率的DCT压缩域字符定位算法 348
13.3.3 基于加权频率的DCT压缩域字符定位算法的实验 352
13.4 小波压缩域字符定位 355
13.4.1 字符特征在小波压缩域图像中的表示 355
13.4.2 基于小波压缩域的字符定位算法 357
13.4.3 基于小波压缩域字符定位算法的实验 362
13.5 讨论 363
参考文献 364
第14章 压缩域的肤色分割 366
14.1 概述 366
14.2 DCT压缩域基于三维椭圆模型的自适应肤色分割 367
14.2.1 三维椭圆肤色模型 367
14.2.2 基于DCT直流系数的肤色初分割 371
14.2.3 自适应修正分割结果 372
14.2.4 DCT压缩域中基于三维椭圆模型的自适应肤色分割实验 373
14.3 小波压缩域双适形肤色分割模型 375
14.3.1 双适形肤色模型 375
14.3.2 小波压缩域基于双适形模型的肤色分割 377
14.3.3 平滑滤波与连通域分析 378
14.4 讨论 378
参考文献 379
第15章 压缩域的人脸检测 381
15.1 概述 381
15.2 DCT压缩域的人脸检测方法 383
15.2.1 一种基于多级梯度能量特征的DCT压缩域人脸检测算法框图 383
15.2.2 多级梯度能量特征 385
15.2.3 级联分类器 387
15.2.4 搜索策略 388
15.2.5 基于多级梯度能量描述的DCT压缩域人脸检测算法的实验 389
15.3 小波压缩域的人脸检测 390
15.3.1 一种基于多级梯度能量描述的小波压缩域人脸检测算法框图 390
15.3.2 多级梯度能量描述 391
15.3.3 级联检测器 394
15.3.4 搜索策略 396
15.3.5 结果仲裁 397
15.3.6 实验结果 397
15.4 讨论 400
参考文献 400
第16章 基于JPEG2000压缩码流的检索方法 400
16.1 概述 402
16.2 JPEG2000码流结构及包头信息 403
16.3 基于JPEG2000压缩码流的图像检索 404
16.3.1 提取包头信息 404
16.3.2 基于包头信息构建特征量 405
16.3.3 特征量归一化 406
16.3.4 相似度匹配 406
16.4 基于JPEG2000压缩码流检索方法的实验 407
16.4.1 特征量计算及相似度匹配 407
16.4.2 检索结果的准确性 408
16.4.3 检索效率与压缩比的讨论 410
16.5 讨论 412
参考文献 412
第17章 基于反对称双正交小波的压缩域图像检索方法 412
17.1 概述 413
17.2 基于反对称双正交小波的多尺度边缘提取算法的研究 414
17.2.1 小波用于图像边缘提取 414
17.2.2 反对称双正交小波的多尺度边缘提取算法 417
17.2.3 基于反对称双正交小波多尺度边缘提取算法实验 421
17.3 方向梯度相角直方图及其特性 424
17.3.1 方向梯度相角直方图的构造 424
17.3.2 方向梯度相角直方图的特性 426
17.4 基于反对称双正交小波的压缩域图像检索算法的研究 431
17.4.1 基于反对称双正交小波的图像压缩编码算法 431
17.4.2 基于反对称双正交小波的压缩域图像检索算法 432
17.4.3 基于反对称双正交小波的压缩域图像检索算法实验 432
17.5 讨论 437
附录:小波滤波器系数 438
参考文献 439
第18章 一种支持检索的分类矢量量化压缩编码方法 439
18.1 概述 441
18.2 不同量化方法与图像检索 442
18.2.1 标量量化 442
18.2.2 矢量量化 442
18.2.3 分类矢量量化 444
18.2.4 检索性能分析 445
18.3 一种支持检索的分类矢量量化压缩编码算法的研究 447
18.3.1 基于反对称双正交小波的分类矢量量化压缩编码算法框图 448
18.3.2 矢量码书的设计 450
18.3.3 基于压缩数据的图像检索 454
18.3.4 一种支持检索的分类矢量量化压缩编码算法实验 456
18.4 讨论 460
参考文献 460
第19章 一种支持检索的迭代分形图像压缩方法 460
19.1 概述 462
19.2 迭代分形编码 463
19.2.1 迭代分形编码的理论基础 463
19.2.2 迭代分形编码的基本原理 465
19.2.3 分形与其他方法的结合 466
19.2.4 迭代分形用于图像检索的分析 467
19.3 基于迭代分形的图像压缩编码与检索算法研究 467
19.3.1 小波变换域内基于迭代分形的图像压缩编码算法 468
19.3.2 基于迭代分形压缩数据的图像检索的实现 471
19.3.3 基于迭代分形的图像压缩编码与其检索算法实验 472
19.4 讨论 475
参考文献 476
第四篇 结束语 481
第20章 结束语 481
20.1 人眼视觉系统特性的讨论 481
20.2 视频关键帧的压缩域提取 482
20.2.1 等时间间隔采样方法的关键帧提取 482
20.2.2 基于帧间内容变化方法的关键帧提取 483
20.2.3 基于聚类方法的关键帧提取 484
20.2.4 针对敏感视频识别应用的关键帧的提取方案 484
20.3 语义鸿沟 485
20.3.1 基于对象本体论定义高层语义 486
20.3.2 机器学习方法建立低层视觉特征与高层语义的关系 486
20.3.3 相关反馈学习用户主观意图 488
20.3.4 生成语义模板支持高层图像检索 488
20.3.5 讨论 489
20.4 压缩域图像特征的提取 490
20.4.1 压缩域图像中的空间视觉特征 490
20.4.2 压缩域编码特征 491
20.4.3 不同压缩域的统一特征 492
20.4.4 讨论 492
参考文献 493