《图像检索与压缩域处理技术的研究》PDF下载

  • 购买积分:15 如何计算积分?
  • 作  者:沈兰荪,张菁,李晓光著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2008
  • ISBN:9787115189943
  • 页数:497 页
图书介绍:本书是关于图像检索与压缩域处理技术的一本学术专著,反映了相关技术领域近年来的最新研究进展。全书共分四篇二十章,主要介绍了数字图像以及编码的基础知识、图像编码的基本方法与有关国际标准;基于内容的图像检索技术,客观化的视觉感知技术以及个性图像检索技术,基于压缩域的图像处理技术,包括压缩域纹理图像分类、基于轮廓特征的检索、DCT域处理、小波域处理以及JPEG2000等。

第一篇 基础知识 3

第1章 数字图像 3

1.1 图像与视频 3

1.2 数字图像的特点 4

1.2.1 图像数据的海量性 4

1.2.2 图像的压缩格式具有普遍性 5

1.2.3 图像的内容表现具有非结构性 6

1.2.4 应用环境的多元化 6

1.3 图像的彩色空间 7

1.3.1 彩色空间的视觉属性 7

1.3.2 RGB彩色空间 7

1.3.3 YCbCr彩色空间 8

1.4 视频格式 9

1.5 感兴趣区的人眼视觉系统特性 10

1.5.1 视觉感兴趣区 10

1.5.2 视觉掩盖效应 11

1.6 图像质量的评价 15

1.6.1 概述 15

1.6.2 客观质量的评价 16

1.6.3 主观质量的评价 16

1.6.4 感兴趣区质量评价 17

1.6.5 感兴趣区质量评价的实验结果 19

1.7 讨论 21

参考文献 21

第2章 图像压缩编码技术的发展 23

2.1 概述 23

2.2 熵编码 24

2.3 传统的图像/视频编码技术 25

2.3.1 预测编码 25

2.3.2 变换编码 26

2.3.3 矢量量化 28

2.4 新型图像/视频编码技术 28

2.4.1 第二代图像编码方法 29

2.4.2 分形编码 29

2.4.3 模型编码 30

2.4.4 小波编码 31

2.5 图像/视频编码标准 32

2.5.1 静止图像编码的标准 35

2.5.2 视频编码标准 35

2.6 JPEG2000标准 40

2.6.1 JPEG2000体系结构与关键技术 40

2.6.2 JPEG2000的主要特点与性能描述 45

2.7 讨论 46

参考文献 49

第3章 基于内容的图像检索技术 52

3.1 概述 52

3.2 图像的内容特征 54

3.2.1 颜色特征 55

3.2.2 纹理特征 57

3.2.3 轮廓特征 60

3.2.4 形状特征 60

3.2.5 对象特征 61

3.2.6 空间特征 63

3.2.7 字符特征 64

3.2.8 语义特征 64

3.2.9 图像的语义层次模型 66

3.3 图像相似度计算 67

3.3.1 距离度量 67

3.3.2 相关计算 68

3.3.3 关联系数计算 69

3.3.4 多特征相似度计算 70

3.3.5 具有光照不变性的图像检索 70

3.4 人机接口及相关反馈 71

3.4.1 友好的人机交互接口 71

3.4.2 相关反馈的新进展 74

3.5 图像的检索 76

3.5.1 低层视觉特征 76

3.5.2 局部图像 76

3.5.3 自定义特征检索 77

3.5.4 示例图与草图检索 77

3.5.5 浏览检索 77

3.6 图像检索系统 78

3.7 图像检索性能的评价 79

3.8 讨论 80

参考文献 82

第二篇 基于视觉感知的个性化图像检索第4章 视觉注意机制及注意模型 82

4.1 概述 89

4.2 人眼视觉系统的生理特性 90

4.2.1 视觉感官 92

4.2.2 视觉通路 93

4.2.3 视觉中枢 94

4.2.4 视觉感知 97

4.3 视觉注意机制 98

4.3.1 What和Where视觉通路 98

4.3.2 预注意和注意阶段 99

4.3.3 自底向上和自顶向下的注意模式 99

4.3.4 选择性注意机制 100

4.3.5 注意焦点的选择与转移 102

4.4 视觉注意模型 102

4.4.1 基于空间的注意模型 103

4.4.2 基于特征的注意模型 111

4.4.3 基于空间和特征整合的注意模型 112

4.4.4 基于对象的注意模型 112

4.5 讨论 113

参考文献 114

第5章 基于视觉注意模型的感兴趣区检测 114

5.1 概述 118

5.2 感兴趣区检测的研究进展 119

5.3 一种基于改进Itti模型与进化规划的感兴趣区检测方法 121

5.3.1 视觉显著度量 122

5.3.2 注意焦点的选择与转移 124

5.3.3 感兴趣区的生成 126

5.3.4 一种基于改进Itti模型与进化规划的感兴趣区检测方法的实验 128

5.4 基于相似距离的Top-Down模型的初步研究 135

5.4.1 基于相似距离的Top-Down模型结构 135

5.4.2 相似区域的判定方法 136

5.4.3 基于相似距离的视觉期望 137

5.4.4 基于相似距离的Top-Down模型的初步实验 138

5.5 讨论 139

参考文献 140

第6章 视点跟踪技术 142

6.1 概述 142

6.2 视点跟踪技术的研究进展 143

6.2.1 人眼的运动特性 143

6.2.2 视点跟踪设备 144

6.2.3 人眼检测与定位 145

6.2.4 视点跟踪技术分类 147

6.3 改造的视点跟踪设备 150

6.3.1 视点跟踪设备的选择及参数设置 150

6.3.2 视点跟踪设备的改造方案 154

6.3.3 方案选择与对比 157

6.4 基于Gabor变换的人眼定位方法 157

6.4.1 归一化处理 158

6.4.2 Gabor小波变换 159

6.4.3 投影分析 160

6.4.4 基于Gabor变换的人眼定位方法的实验 161

6.5 一种基于双阈值的低复杂度视点跟踪方法 163

6.5.1 双阈值人眼定位算法 163

6.5.2 双阈值人眼定位算法的实验 166

6.5.3 基于几何映射的视点跟踪方法 167

6.5.4 一种基于双阈值的低复杂度视点跟踪方法的实验 168

6.6 一种基于Web Camera的自适应模板视点跟踪方法 169

6.6.1 自适应模板人眼定位算法 169

6.6.2 自适应模板人眼定位算法的实验 171

6.6.3 基于神经网络法的视点跟踪方法 172

6.6.4 一种基于Web Camera的自适应模板视点跟踪方法的实验 174

6.7 讨论 175

参考文献 176

第7章 客观化的视觉感知技术 179

7.1 概述 179

7.2 客观化的视觉感知信息 180

7.3 基于视觉感知的感兴趣区检测 181

7.3.1 注视点分布图 181

7.3.2 注视兴趣度 183

7.3.3 基于视觉感知的感兴趣区 184

7.4 基于视觉感知的感兴趣区检测实验平台 186

7.4.1 实验平台 186

7.4.2 实验结果 188

7.5 讨论 198

参考文献 199

第8章 个性化图像检索技术 200

8.1 概述 200

8.2 图像搜索引擎 202

8.3 用户兴趣模型 205

8.3.1 Agent推理机 205

8.3.2 个性化文件 209

8.3.3 用户兴趣模型的更新 213

8.4 基于规则的个性化推荐 214

8.5 基于内容的个性化推荐 218

8.5.1 概述 218

8.5.2 潜在变量分析 219

8.5.3 广义概率主分量分析模型 221

8.6 协作过滤的个性化推荐 224

8.6.1 概述 224

8.6.2 基于记忆的协作过滤 225

8.6.3 基于模型的协作过滤 229

8.6.4 基于协作过滤的图像检索 230

8.7 混合过滤的个性化推荐 233

8.8 个性化推荐系统的评价 235

8.9 相关反馈技术 235

8.10 讨论 237

参考文献 238

第9章 应用于个性化图像检索的用户兴趣模型的构建 238

9.1 概述 242

9.2 用户兴趣模型描述 243

9.2.1 用户兴趣的表示方式 243

9.2.2 用户兴趣模型的分类 244

9.2.3 用户兴趣模型的构建方法 245

9.2.4 用户兴趣模型的框图 246

9.3 用户短期兴趣的获取 247

9.3.1 短期视觉特征 248

9.3.2 短期视觉特征实验结果 253

9.3.3 短期语义特征 257

9.3.4 短期语义特征实验结果 262

9.4 用户长期兴趣的获取 263

9.4.1 推理机的设计与实现 264

9.4.2 长期视觉特征 265

9.4.3 长期视觉特征实验结果 266

9.4.4 长期语义特征 270

9.4.5 长期语义特征实验结果 273

9.5 基于用户兴趣模型的个性化图像检索系统 273

9.5.1 个性化图像检索系统组成 273

9.5.2 个性化图像检索实验结果与分析 274

9.6 讨论 281

参考文献 282

第三篇 基于压缩域的图像处理 287

第10章 压缩域图像处理技术综述 287

10.1 概述 287

10.2 压缩域图像处理系统的构成 288

10.2.1 基于压缩域的图像检索系统框图 289

10.2.2 压缩域处理可操作位置 289

10.3 压缩域图像处理的研究方法 290

10.3.1 寻求对等操作 291

10.3.2 寻求特有操作 291

10.4 压缩域图像检索技术的研究进展 292

10.4.1 变换压缩域检索技术 292

10.4.2 空间压缩域检索技术 298

10.4.3 混合压缩域检索技术 299

参考文献 300

第11章 压缩域纹理图像分类 305

11.1 概述 305

11.2 基于DCT压缩域区域能量方向性的纹理图像分类 306

11.2.1 基于DCT编码的基本框图 306

11.2.2 DCT域区域能量的方向性 307

11.2.3 基于能量方向性的纹理图像分类算法设计 309

11.2.4 基于DCT压缩域区域能量方向性的纹理图像分类算法实验 310

11.3 基于DCT压缩域的具有旋转不变性的纹理图像分类 312

11.3.1 DCT域的多分辨率特性 312

11.3.2 具有抗旋转性的纹理图像分类方法 314

11.3.3 基于DCT压缩域的具有旋转不变性的纹理图像分类算法实验 315

11.4 基于小波压缩域纹理图像分类 317

11.4.1 基于小波的纹理分析方法的发展 317

11.4.2 基于子带间相关性纹理特征提取 318

11.4.3 基于小波压缩域纹理图像分类算法 321

11.4.4 基于小波压缩域纹理图像分类算法实验 321

11.5 讨论 323

参考文献 324

第12章 DCT压缩域基于轮廓特征的图像检索 324

12.1 概述 327

12.2 基于图像检索的连通直方图方法 328

12.2.1 图像的连通直方图 328

12.2.2 基于连通直方图的图像检索 330

12.2.3 基于连通直方图的图像检索的实验 331

12.3 DCT压缩域基于轮廓特征的图像检索方法 333

12.3.1 重组DCT系数 334

12.3.2 提取图像的轮廓 334

12.3.3 基于轮廓的连通直方图 336

12.3.4 DCT压缩域基于轮廓特征的图像检索流程 337

12.3.5 DCT压缩域基于轮廓特征的图像检索的实验 337

12.4 讨论 340

参考文献 340

第13章 压缩域字符定位 341

13.1 概述 341

13.2 DCT压缩域的字符定位方法 343

13.2.1 DCT压缩域中字符特征的提取 343

13.2.2 DCT压缩域的字符定位算法 344

13.2.3 DCT压缩域字符定位算法的实验 345

13.3 基于加权频率的DCT压缩域的字符定位方法 347

13.3.1 DCT压缩域字符区新特征——加权频率 347

13.3.2 基于加权频率的DCT压缩域字符定位算法 348

13.3.3 基于加权频率的DCT压缩域字符定位算法的实验 352

13.4 小波压缩域字符定位 355

13.4.1 字符特征在小波压缩域图像中的表示 355

13.4.2 基于小波压缩域的字符定位算法 357

13.4.3 基于小波压缩域字符定位算法的实验 362

13.5 讨论 363

参考文献 364

第14章 压缩域的肤色分割 366

14.1 概述 366

14.2 DCT压缩域基于三维椭圆模型的自适应肤色分割 367

14.2.1 三维椭圆肤色模型 367

14.2.2 基于DCT直流系数的肤色初分割 371

14.2.3 自适应修正分割结果 372

14.2.4 DCT压缩域中基于三维椭圆模型的自适应肤色分割实验 373

14.3 小波压缩域双适形肤色分割模型 375

14.3.1 双适形肤色模型 375

14.3.2 小波压缩域基于双适形模型的肤色分割 377

14.3.3 平滑滤波与连通域分析 378

14.4 讨论 378

参考文献 379

第15章 压缩域的人脸检测 381

15.1 概述 381

15.2 DCT压缩域的人脸检测方法 383

15.2.1 一种基于多级梯度能量特征的DCT压缩域人脸检测算法框图 383

15.2.2 多级梯度能量特征 385

15.2.3 级联分类器 387

15.2.4 搜索策略 388

15.2.5 基于多级梯度能量描述的DCT压缩域人脸检测算法的实验 389

15.3 小波压缩域的人脸检测 390

15.3.1 一种基于多级梯度能量描述的小波压缩域人脸检测算法框图 390

15.3.2 多级梯度能量描述 391

15.3.3 级联检测器 394

15.3.4 搜索策略 396

15.3.5 结果仲裁 397

15.3.6 实验结果 397

15.4 讨论 400

参考文献 400

第16章 基于JPEG2000压缩码流的检索方法 400

16.1 概述 402

16.2 JPEG2000码流结构及包头信息 403

16.3 基于JPEG2000压缩码流的图像检索 404

16.3.1 提取包头信息 404

16.3.2 基于包头信息构建特征量 405

16.3.3 特征量归一化 406

16.3.4 相似度匹配 406

16.4 基于JPEG2000压缩码流检索方法的实验 407

16.4.1 特征量计算及相似度匹配 407

16.4.2 检索结果的准确性 408

16.4.3 检索效率与压缩比的讨论 410

16.5 讨论 412

参考文献 412

第17章 基于反对称双正交小波的压缩域图像检索方法 412

17.1 概述 413

17.2 基于反对称双正交小波的多尺度边缘提取算法的研究 414

17.2.1 小波用于图像边缘提取 414

17.2.2 反对称双正交小波的多尺度边缘提取算法 417

17.2.3 基于反对称双正交小波多尺度边缘提取算法实验 421

17.3 方向梯度相角直方图及其特性 424

17.3.1 方向梯度相角直方图的构造 424

17.3.2 方向梯度相角直方图的特性 426

17.4 基于反对称双正交小波的压缩域图像检索算法的研究 431

17.4.1 基于反对称双正交小波的图像压缩编码算法 431

17.4.2 基于反对称双正交小波的压缩域图像检索算法 432

17.4.3 基于反对称双正交小波的压缩域图像检索算法实验 432

17.5 讨论 437

附录:小波滤波器系数 438

参考文献 439

第18章 一种支持检索的分类矢量量化压缩编码方法 439

18.1 概述 441

18.2 不同量化方法与图像检索 442

18.2.1 标量量化 442

18.2.2 矢量量化 442

18.2.3 分类矢量量化 444

18.2.4 检索性能分析 445

18.3 一种支持检索的分类矢量量化压缩编码算法的研究 447

18.3.1 基于反对称双正交小波的分类矢量量化压缩编码算法框图 448

18.3.2 矢量码书的设计 450

18.3.3 基于压缩数据的图像检索 454

18.3.4 一种支持检索的分类矢量量化压缩编码算法实验 456

18.4 讨论 460

参考文献 460

第19章 一种支持检索的迭代分形图像压缩方法 460

19.1 概述 462

19.2 迭代分形编码 463

19.2.1 迭代分形编码的理论基础 463

19.2.2 迭代分形编码的基本原理 465

19.2.3 分形与其他方法的结合 466

19.2.4 迭代分形用于图像检索的分析 467

19.3 基于迭代分形的图像压缩编码与检索算法研究 467

19.3.1 小波变换域内基于迭代分形的图像压缩编码算法 468

19.3.2 基于迭代分形压缩数据的图像检索的实现 471

19.3.3 基于迭代分形的图像压缩编码与其检索算法实验 472

19.4 讨论 475

参考文献 476

第四篇 结束语 481

第20章 结束语 481

20.1 人眼视觉系统特性的讨论 481

20.2 视频关键帧的压缩域提取 482

20.2.1 等时间间隔采样方法的关键帧提取 482

20.2.2 基于帧间内容变化方法的关键帧提取 483

20.2.3 基于聚类方法的关键帧提取 484

20.2.4 针对敏感视频识别应用的关键帧的提取方案 484

20.3 语义鸿沟 485

20.3.1 基于对象本体论定义高层语义 486

20.3.2 机器学习方法建立低层视觉特征与高层语义的关系 486

20.3.3 相关反馈学习用户主观意图 488

20.3.4 生成语义模板支持高层图像检索 488

20.3.5 讨论 489

20.4 压缩域图像特征的提取 490

20.4.1 压缩域图像中的空间视觉特征 490

20.4.2 压缩域编码特征 491

20.4.3 不同压缩域的统一特征 492

20.4.4 讨论 492

参考文献 493