第1部分 技术基础篇 3
第1章 基于内容的图像检索基础 3
1.1引言 3
1.2图像内容描述符 4
1.2.1颜色 5
1.2.2纹理 8
1.2.3形状 12
1.2.4空间信息 15
1.3相似度测量和索引方案 15
1.3.1相似度/距离测量 15
1.3.2索引方案 17
1.4用户交互 18
1.4.1查询说明 18
1.4.2相关反馈 18
1.5性能评价 19
1.6结论 20
参考文献 21
第2章 基于内容的视频分析、检索和浏览 26
2.1引言 26
2.2视频结构分析 27
2.2.1镜头边界检测 28
2.2.2场景分组 30
2.2.3情节分割 30
2.3视频内容表达 31
2.3.1基于关键帧的表达 32
2.3.2基于镜头的表达 32
2.4视频提取和视频摘要 39
2.4.1关键帧抽取 39
2.4.2视频高亮显示 41
2.5基于内容的视频检索和浏览 42
2.5.1相似性度量 42
2.5.2镜头聚类 44
2.5.3浏览方案 44
2.6结论 46
致谢 47
参考文献 47
第3章 基于内容的图像检索的相关反馈 51
3.1引言 51
3.2相关反馈算法 52
3.2.1经典算法 52
3.2.2作为学习问题的相关反馈 53
3.2.3带记忆的相关反馈 56
3.3一个集成相关反馈框架 57
3.3.1语义网络 58
3.3.2集成和跨模态查询和检索 59
3.3.3概率传播方案 60
3.3.4实验结果 61
3.4结论 62
致谢 63
参考文献 63
第4章 结构和语义层次的视频分析和摘要 66
4.1引言 66
4.2场景分析 67
4.2.1计算场景定义 67
4.2.2方法 69
4.3事件分析 71
4.3.1方法 71
4.4视频摘要 73
4.4.1图像故事板 73
4.4.2缩略视频 74
4.4.3“最优”摘要存在吗 77
4.5结论 78
致谢 79
参考文献 79
第5章 数字音频和音乐的基于内容的检索 83
5.1引言 83
5.2音频特征抽取 84
5.2.1声学特征 84
5.2.2主观/语义特征 85
5.3一般音频分类和检索 86
5.3.1基于内容的音频分割 86
5.3.2基于内容的音频检索 87
5.4音乐内容分析 88
5.4.1音乐分割 88
5.4.2音乐类型分类 89
5.4.3音乐摘要 89
5.4.4乐器鉴定 90
5.4.5音乐标注 91
5.5基于内容的音乐检索 92
5.6案例研究 93
5.6.1基于内容的音频检索 93
5.6.2基于内容的音乐哼唱检索 97
5.7结论 100
5.7.1从录音中提取旋律 100
5.7.2检索精度 101
5.7.3基于Web的搜索引擎 101
致谢 101
参考文献 101
第6章 MPEG-7多媒体内容描述标准 105
6.1引言 105
6.2背景和应用 106
6.2.1 MPEG背景 106
6.2.2MPEG-7应用 107
6.3 MPEG-7结构 109
6.3.1 MPEG-7组成部分 109
6.3.2 MPEG-7基本结构 109
6.3.3 MPEG-7可扩展性 110
6.4 MPEG-7概念模型 111
6.5 MPEG-7描述定义语言 112
6.6 MPEG-7多媒体描述方案 113
6.6.1基本元素 114
6.6.2内容描述工具 114
6.6.3内容组织、导航和访问、用户交互 114
6.6.4分类方案 115
6.6.5例子 115
6.7 MPEG-7音频描述工具 119
6.7.1低层次音频工具 119
6.7.2高层次音频工具 120
6.7.3例子 120
6.8 MPEG-7视觉描述工具 122
6.8.1颜色 122
6.8.2纹理 122
6.8.3形状 123
6.8.4运动 123
6.8.5定位 123
6.8.6人脸 123
6.8.7例子 123
6.9 MPEG-7的未来 125
参考文献 125
第7章 多媒体认证和水印技术 129
7.1引言 129
7.2多媒体认证范例 131
7.2.1需求 131
7.2.2对多媒体认证系统的攻击 132
7.3多媒体认证方案 133
7.3.1使用脆弱水印的硬多媒体认证 133
7.3.2使用半脆弱水印的软多媒体认证 137
7.3.3基于内容的认证 140
7.4结论 147
参考文献 147
第8章 索引和检索高维视觉特征 151
8.1引言 151
8.2 R树家族 154
8.3 CSS+树 155
8.3.1 CSS+树的一般结构 155
8.3.2 CSS+树的批量加载 156
8.3.3 CSS+树的动态行为 158
8.3.4同其他层次化结构的比较 160
8.4处理不同的距离度量 161
8.4.1用加权欧氏距离进行k-nn搜索的方法 162
8.4.2到高维空间的扩展 163
8.4.3实验结果和讨论 163
8.5降维 164
8.5.1使用混合联想神经网络降维 165
8.5.2降维结果 166
8.6结论 168
参考文献 169
第9章 多媒体数据库的语义数据建模机制 172
9.1引言 172
9.2语义和多媒体数据建模技术 174
9.2.1多媒体数据库技术 174
9.2.2面向对象的视图机制 174
9.2.3动态对象模型 175
9.3 MediaView:一种语义建模机制 176
9.3.1概貌 176
9.3.2 MediaView的基本原理 177
9.3.3视图算子 180
9.3.4视图推导机制 181
9.4 MediaView的应用 184
9.4.1多媒体查询 184
9.4.2“媒体地图”中的导航 186
9.4.3存储和索引的优化 187
9.5结论 187
参考文献 188
第10章 可视化数据库系统中基于特征的检索 190
10.1引言 190
10.2可视化数据库系统设计 191
10.3元数据层次 193
10.3.1特征索引 194
10.3.2聚类和模板 196
10.3.3异类特征的聚类 196
10.4异类特征的查询 199
10.4.1使用异类特征排序图像 200
10.4.2合并异类特征 202
10.4.3相关反馈的集成 202
10.5结论 203
致谢 204
参考文献 204
第2部分 应用篇 209
第11章 数字图书馆 209
11.1数字图书馆定义 209
11.2数字图书馆创新工程(第一阶段) 211
11.3 DLI项目 212
11.3.1卡内基梅隆大学“视频的全内容搜索和检索” 212
11.3.2伊利诺斯大学乌尔班纳-香巴尼分校“科学文献的联合知识库” 215
11.3.3斯坦福大学“异类服务中的互操作机制” 217
11.4 DLI二期 219
11.4.1以人为中心的研究 220
11.4.2基于内容和馆藏的研究 220
11.4.3以系统为中心的研究 221
11.4.4建立测试平台 221
11.4.5总结 222
11.5结论 222
参考文献 222
第12章 数字图书馆的可扩展存储 225
12.1引言 225
12.2动机 226
12.3主题领域 226
12.4本地文件系统 227
12.5工作负载研究 227
12.6本地文件系统性能问题 230
12.6.1高速缓存 230
12.6.2聚集和分裂 231
12.6.3块尺寸和分配 231
12.6.4日志结构的方法 232
12.7磁盘阵列 232
12.8网络化存储 236
12.8.1智能磁盘 237
12.8.2并行文件系统 238
12.8.3分布式文件系统 239
12.9结论 241
参考文献 241
第13章 数字图书馆的对象知识库 247
13.1引言 247
13.2数字对象与文件 248
13.3命名和定位 249
13.3.1唯一性与定位依赖性 249
13.3.2统一资源名称 250
13.3.3可扩展的对象定位 251
13.4可靠性冗余编码 252
13.5元数据 253
13.5.1桶 254
13.5.2条款和条件 254
13.6 数字对象知识库 255
13.6.1 KAHN-WILENSKY及其扩展 256
13.6.2其他的知识库方法 257
13.7结论 258
参考文献 259
第14章 万维网上的信息发现 263
14.1引言 263
14.2 Web结构挖掘 267
14.2.1权威和枢纽 267
14.2.2锚点 268
14.2.3网页排名 271
14.3 Web日志挖掘 272
14.3.1用户模型 272
14.3.2因特网GLOSS 273
14.4结论 276
参考文献 276
第15章 协同多媒体信息系统 278
15.1引言 278
15.1.1协同多媒体信息系统定义 279
15.1.2多媒体信息系统的分类 279
15.2协同多媒体信息系统回顾 280
15.2.1多媒体会议 280
15.2.2集成工具集 283
15.3体系结构实例 285
15.3.1 MARRATECH 285
15.3.2多媒体交互式远程学习系统 286
15.3.3会议纪要系统 287
15.3.4 TEAMSMART 287
15.4管理问题 289
15.5结论 291
参考文献 291
第16章 图片存档及通信系统、图像管理和影像信息学 297
16.1图片存档及通信系统(PACS)基础 297
16.1.1 PACS组件 297
16.1.2医学图像 299
16.1.3术语和标准 300
16.1.4 IHE和PACS数据流 301
16.1.5 HIS/CMS和电子病历 301
16.2图像数据通信和管理 302
16.2.1图像通信 302
16.2.2大尺度图像数据管理 305
16.3影像信息学 307
16.3.1医学影像信息学基础设施 307
16.3.2 NCM—神经外科病人数据的管理 309
16.4总结 311
16.5结论 311
致谢 312
参考文献 312
第17章 医学数据基于内容的检索 313
17.1引言 313
17.2一维医学数据基于内容的检索 314
17.3二维医学数据基于内容的检索 315
17.4三维医学数据基于内容的检索 316
17.5四维医学数据基于内容的检索 318
17.5.1示踪剂动力学特征提取和数据压缩 319
17.5.2四维功能图像检索系统 321
17.5.3案例研究 323
17.6结论 324
致谢 325
参考文献 325
第18章 使用掌纹图像的生物特征检索 329
18.1引言 329
18.2动态特征选择 335
18.3分式判别函数 336
18.4分层掌纹匹配 337
18.5实验结果 340
18.6结论 341
致谢 342
参考文献 342
第19章 在人脸数据库中查找人脸 344
19.1人脸识别:综述和挑战 344
19.1.1自动人脸识别的应用 344
19.1.2人脸识别系统的结构 345
19.2特征脸 346
19.3复杂背景中的人脸检测 347
19.3.1颜色空间 347
19.3.2类似人脸区域的分割 348
19.4面部特征检测和提取 352
19.4.1提取人脸轮廓 353
19.4.2变形模板 355
19.5从人脸数据库中搜索人脸 358
19.5.1基于特征脸的人脸识别 358
19.5.2使用豪斯多夫距离度量的人脸识别 359
19.6结论 363
参考文献 364
第20章 活体植物识别的数据管理 366
20.1引言 366
20.1.1植物识别和智能信息处理 367
20.1.2植物数据管理 367
20.2植物学家识别植物的方法 367
20.3植物识别和植物数据管理系统 369
20.3.1 Lucid:多媒体知识管理工具 369
20.3.2 Uconn植物数据库 369
20.3.3 CalFlora:维管植物数据库 370
20.3.4计算机辅助植物识别系统 370
20.4植物图像处理和特征提取 371
20.4.1叶子图像处理 371
20.4.2花图像处理 375
20.5叶子与花的图像检索 377
20.5.1叶子图像检索 377
20.5.2花图像检索 381
20.6结论 384
参考文献 384
第21章 广播视频的快速启动与交互式检索 387
21.1引言 387
21.2通用广播方案 389
21.2.1锥形广播方案 390
21.2.2摩天楼广播方案 390
21.2.3贪心磁盘节约型广播方案 390
21.3预取模式——积极的与适时的 391
21.4快进和向前跳读 392
21.4.1短程快进广播方案 393
21.4.2主动缓冲区管理方案 395
21.4.3镜像锥形广播方案 396
21.4.4向前跳读 397
21.5暂停-重新开始、倒带和向后复位 397
21.6结论 398
致谢 398
参考文献 399