《多媒体信息检索与管理》PDF下载

购买积分：13 如何计算积分？
作　　者：冯大淦，萧允治，张宏江著
出版社：北京：清华大学出版社
出版年份：2009
ISBN：9787302211617
页数：400 页

图书介绍：这是一本关于多媒体信息检索和管理领域的经典著作，倾注了该领域世界众多学者的研究成果和贡献，在国外许多重点大学作为计算机专业本科生和研究生的教材。

点击购买此书全本PDF电子书

第1部分技术基础篇 3

第1章基于内容的图像检索基础 3

1.1引言 3

1.2图像内容描述符 4

1.2.1颜色 5

1.2.2纹理 8

1.2.3形状 12

1.2.4空间信息 15

1.3相似度测量和索引方案 15

1.3.1相似度/距离测量 15

1.3.2索引方案 17

1.4用户交互 18

1.4.1查询说明 18

1.4.2相关反馈 18

1.5性能评价 19

1.6结论 20

参考文献 21

第2章基于内容的视频分析、检索和浏览 26

2.1引言 26

2.2视频结构分析 27

2.2.1镜头边界检测 28

2.2.2场景分组 30

2.2.3情节分割 30

2.3视频内容表达 31

2.3.1基于关键帧的表达 32

2.3.2基于镜头的表达 32

2.4视频提取和视频摘要 39

2.4.1关键帧抽取 39

2.4.2视频高亮显示 41

2.5基于内容的视频检索和浏览 42

2.5.1相似性度量 42

2.5.2镜头聚类 44

2.5.3浏览方案 44

2.6结论 46

致谢 47

参考文献 47

第3章基于内容的图像检索的相关反馈 51

3.1引言 51

3.2相关反馈算法 52

3.2.1经典算法 52

3.2.2作为学习问题的相关反馈 53

3.2.3带记忆的相关反馈 56

3.3一个集成相关反馈框架 57

3.3.1语义网络 58

3.3.2集成和跨模态查询和检索 59

3.3.3概率传播方案 60

3.3.4实验结果 61

3.4结论 62

致谢 63

参考文献 63

第4章结构和语义层次的视频分析和摘要 66

4.1引言 66

4.2场景分析 67

4.2.1计算场景定义 67

4.2.2方法 69

4.3事件分析 71

4.3.1方法 71

4.4视频摘要 73

4.4.1图像故事板 73

4.4.2缩略视频 74

4.4.3“最优”摘要存在吗 77

4.5结论 78

致谢 79

参考文献 79

第5章数字音频和音乐的基于内容的检索 83

5.1引言 83

5.2音频特征抽取 84

5.2.1声学特征 84

5.2.2主观／语义特征 85

5.3一般音频分类和检索 86

5.3.1基于内容的音频分割 86

5.3.2基于内容的音频检索 87

5.4音乐内容分析 88

5.4.1音乐分割 88

5.4.2音乐类型分类 89

5.4.3音乐摘要 89

5.4.4乐器鉴定 90

5.4.5音乐标注 91

5.5基于内容的音乐检索 92

5.6案例研究 93

5.6.1基于内容的音频检索 93

5.6.2基于内容的音乐哼唱检索 97

5.7结论 100

5.7.1从录音中提取旋律 100

5.7.2检索精度 101

5.7.3基于Web的搜索引擎 101

致谢 101

参考文献 101

第6章 MPEG-7多媒体内容描述标准 105

6.1引言 105

6.2背景和应用 106

6.2.1 MPEG背景 106

6.2.2MPEG-7应用 107

6.3 MPEG-7结构 109

6.3.1 MPEG-7组成部分 109

6.3.2 MPEG-7基本结构 109

6.3.3 MPEG-7可扩展性 110

6.4 MPEG-7概念模型 111

6.5 MPEG-7描述定义语言 112

6.6 MPEG-7多媒体描述方案 113

6.6.1基本元素 114

6.6.2内容描述工具 114

6.6.3内容组织、导航和访问、用户交互 114

6.6.4分类方案 115

6.6.5例子 115

6.7 MPEG-7音频描述工具 119

6.7.1低层次音频工具 119

6.7.2高层次音频工具 120

6.7.3例子 120

6.8 MPEG-7视觉描述工具 122

6.8.1颜色 122

6.8.2纹理 122

6.8.3形状 123

6.8.4运动 123

6.8.5定位 123

6.8.6人脸 123

6.8.7例子 123

6.9 MPEG-7的未来 125

参考文献 125

第7章多媒体认证和水印技术 129

7.1引言 129

7.2多媒体认证范例 131

7.2.1需求 131

7.2.2对多媒体认证系统的攻击 132

7.3多媒体认证方案 133

7.3.1使用脆弱水印的硬多媒体认证 133

7.3.2使用半脆弱水印的软多媒体认证 137

7.3.3基于内容的认证 140

7.4结论 147

参考文献 147

第8章索引和检索高维视觉特征 151

8.1引言 151

8.2 R树家族 154

8.3 CSS+树 155

8.3.1 CSS＋树的一般结构 155

8.3.2 CSS＋树的批量加载 156

8.3.3 CSS＋树的动态行为 158

8.3.4同其他层次化结构的比较 160

8.4处理不同的距离度量 161

8.4.1用加权欧氏距离进行k-nn搜索的方法 162

8.4.2到高维空间的扩展 163

8.4.3实验结果和讨论 163

8.5降维 164

8.5.1使用混合联想神经网络降维 165

8.5.2降维结果 166

8.6结论 168

参考文献 169

第9章多媒体数据库的语义数据建模机制 172

9.1引言 172

9.2语义和多媒体数据建模技术 174

9.2.1多媒体数据库技术 174

9.2.2面向对象的视图机制 174

9.2.3动态对象模型 175

9.3 MediaView：一种语义建模机制 176

9.3.1概貌 176

9.3.2 MediaView的基本原理 177

9.3.3视图算子 180

9.3.4视图推导机制 181

9.4 MediaView的应用 184

9.4.1多媒体查询 184

9.4.2“媒体地图”中的导航 186

9.4.3存储和索引的优化 187

9.5结论 187

参考文献 188

第10章可视化数据库系统中基于特征的检索 190

10.1引言 190

10.2可视化数据库系统设计 191

10.3元数据层次 193

10.3.1特征索引 194

10.3.2聚类和模板 196

10.3.3异类特征的聚类 196

10.4异类特征的查询 199

10.4.1使用异类特征排序图像 200

10.4.2合并异类特征 202

10.4.3相关反馈的集成 202

10.5结论 203

致谢 204

参考文献 204

第2部分应用篇 209

第11章数字图书馆 209

11.1数字图书馆定义 209

11.2数字图书馆创新工程（第一阶段） 211

11.3 DLI项目 212

11.3.1卡内基梅隆大学“视频的全内容搜索和检索” 212

11.3.2伊利诺斯大学乌尔班纳-香巴尼分校“科学文献的联合知识库” 215

11.3.3斯坦福大学“异类服务中的互操作机制” 217

11.4 DLI二期 219

11.4.1以人为中心的研究 220

11.4.2基于内容和馆藏的研究 220

11.4.3以系统为中心的研究 221

11.4.4建立测试平台 221

11.4.5总结 222

11.5结论 222

参考文献 222

第12章数字图书馆的可扩展存储 225

12.1引言 225

12.2动机 226

12.3主题领域 226

12.4本地文件系统 227

12.5工作负载研究 227

12.6本地文件系统性能问题 230

12.6.1高速缓存 230

12.6.2聚集和分裂 231

12.6.3块尺寸和分配 231

12.6.4日志结构的方法 232

12.7磁盘阵列 232

12.8网络化存储 236

12.8.1智能磁盘 237

12.8.2并行文件系统 238

12.8.3分布式文件系统 239

12.9结论 241

参考文献 241

第13章数字图书馆的对象知识库 247

13.1引言 247

13.2数字对象与文件 248

13.3命名和定位 249

13.3.1唯一性与定位依赖性 249

13.3.2统一资源名称 250

13.3.3可扩展的对象定位 251

13.4可靠性冗余编码 252

13.5元数据 253

13.5.1桶 254

13.5.2条款和条件 254

13.6 数字对象知识库 255

13.6.1 KAHN-WILENSKY及其扩展 256

13.6.2其他的知识库方法 257

13.7结论 258

参考文献 259

第14章万维网上的信息发现 263

14.1引言 263

14.2 Web结构挖掘 267

14.2.1权威和枢纽 267

14.2.2锚点 268

14.2.3网页排名 271

14.3 Web日志挖掘 272

14.3.1用户模型 272

14.3.2因特网GLOSS 273

14.4结论 276

参考文献 276

第15章协同多媒体信息系统 278

15.1引言 278

15.1.1协同多媒体信息系统定义 279

15.1.2多媒体信息系统的分类 279

15.2协同多媒体信息系统回顾 280

15.2.1多媒体会议 280

15.2.2集成工具集 283

15.3体系结构实例 285

15.3.1 MARRATECH 285

15.3.2多媒体交互式远程学习系统 286

15.3.3会议纪要系统 287

15.3.4 TEAMSMART 287

15.4管理问题 289

15.5结论 291

参考文献 291

第16章图片存档及通信系统、图像管理和影像信息学 297

16.1图片存档及通信系统（PACS）基础 297

16.1.1 PACS组件 297

16.1.2医学图像 299

16.1.3术语和标准 300

16.1.4 IHE和PACS数据流 301

16.1.5 HIS/CMS和电子病历 301

16.2图像数据通信和管理 302

16.2.1图像通信 302

16.2.2大尺度图像数据管理 305

16.3影像信息学 307

16.3.1医学影像信息学基础设施 307

16.3.2 NCM—神经外科病人数据的管理 309

16.4总结 311

16.5结论 311

致谢 312

参考文献 312

第17章医学数据基于内容的检索 313

17.1引言 313

17.2一维医学数据基于内容的检索 314

17.3二维医学数据基于内容的检索 315

17.4三维医学数据基于内容的检索 316

17.5四维医学数据基于内容的检索 318

17.5.1示踪剂动力学特征提取和数据压缩 319

17.5.2四维功能图像检索系统 321

17.5.3案例研究 323

17.6结论 324

致谢 325

参考文献 325

第18章使用掌纹图像的生物特征检索 329

18.1引言 329

18.2动态特征选择 335

18.3分式判别函数 336

18.4分层掌纹匹配 337

18.5实验结果 340

18.6结论 341

致谢 342

参考文献 342

第19章在人脸数据库中查找人脸 344

19.1人脸识别：综述和挑战 344

19.1.1自动人脸识别的应用 344

19.1.2人脸识别系统的结构 345

19.2特征脸 346

19.3复杂背景中的人脸检测 347

19.3.1颜色空间 347

19.3.2类似人脸区域的分割 348

19.4面部特征检测和提取 352

19.4.1提取人脸轮廓 353

19.4.2变形模板 355

19.5从人脸数据库中搜索人脸 358

19.5.1基于特征脸的人脸识别 358

19.5.2使用豪斯多夫距离度量的人脸识别 359

19.6结论 363

参考文献 364

第20章活体植物识别的数据管理 366

20.1引言 366

20.1.1植物识别和智能信息处理 367

20.1.2植物数据管理 367

20.2植物学家识别植物的方法 367

20.3植物识别和植物数据管理系统 369

20.3.1 Lucid：多媒体知识管理工具 369

20.3.2 Uconn植物数据库 369

20.3.3 CalFlora：维管植物数据库 370

20.3.4计算机辅助植物识别系统 370

20.4植物图像处理和特征提取 371

20.4.1叶子图像处理 371

20.4.2花图像处理 375

20.5叶子与花的图像检索 377

20.5.1叶子图像检索 377

20.5.2花图像检索 381

20.6结论 384

参考文献 384

第21章广播视频的快速启动与交互式检索 387

21.1引言 387

21.2通用广播方案 389

21.2.1锥形广播方案 390

21.2.2摩天楼广播方案 390

21.2.3贪心磁盘节约型广播方案 390

21.3预取模式——积极的与适时的 391

21.4快进和向前跳读 392

21.4.1短程快进广播方案 393

21.4.2主动缓冲区管理方案 395

21.4.3镜像锥形广播方案 396

21.4.4向前跳读 397

21.5暂停-重新开始、倒带和向后复位 397

21.6结论 398

致谢 398

参考文献 399