《基于人工智能的多媒体数据挖掘和应用实例》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:张鸿著
  • 出 版 社:武汉:武汉大学出版社
  • 出版年份:2018
  • ISBN:9787307199569
  • 页数:240 页
图书介绍:本书较系统地讲述了基于人工智能的多媒体数据挖掘和应用技术。全书共四个部分,十二个章节,首先以文本和图像为例,介绍了什么是从数据到语义的理解和挖掘;然后详细阐述了如何从底层内容特征的角度,建立多媒体数据的特征表达模型;并在此基础上,进一步以多模态数据为对象,介绍了目前的热点应用,即:跨媒体检索。最后,从数据结构关系和数据存储两个方面,扩展分析了复杂数据环境下的多媒体语义挖掘方法。

第一部分 多媒体数据挖掘概述 3

第一章 从数据到语义的理解与挖掘 3

1.1相关背景 3

1.2信息检索的基本概念 4

1.3纯文本信息的检索 5

1.3.1技术背景 5

1.3.2经典模型 6

1.4基于关键字的多媒体检索 8

1.5本章小结 11

第二章 图像数据挖掘概述——以CBIR为例 12

2.1基本概念 12

2.2主要技术流程和经典算法 14

2.2.1特征建模 15

2.2.2特征降维与索引 16

2.2.3语义相似度度量 17

2.2.4基于相关反馈的结果优化 20

2.3CBIR的相关应用 22

2.3.1国外CBIR开发简介 22

2.3.2数字图书馆中基于内容的多媒体检索 23

2.4本章小结 27

第二部分 多媒体数据的底层特征分析技术 31

第三章 图像的视觉特征分析方法 31

3.1基本概念 31

3.1.1数字图像的组成和存储 31

3.1.2图像的特征类型和表达方式 32

3.2经典的视觉特征及其计算方法 33

3.2.1颜色特征 34

3.2.2纹理特征 39

3.2.3形状特征 42

3.3特征降维的关键技术 44

3.3.1线性降维方法 44

3.3.2非线性降维方法 50

3.4基于深度学习的图像特征表示 51

3.5本章小结 51

第四章 视频多模态底层特征的综合理解 53

4.1视频时序性特征的结构化 53

4.2视频关键帧的计算方法 56

4.3视频镜头的自动分割 58

4.4视频特征的融合分析和深度挖掘 61

4.5视频数据挖掘的相关应用 62

4.6本章小结 64

第五章 音频时序性特征的结构化方法 65

5.1基本概念 65

5.2听觉特征的形式化表达和计算 66

5.2.1时域特征 67

5.2.2频域特征 68

5.2.3压缩域特征 69

5.2.4特征计算的基本单位 70

5.3音频数据挖掘的相关应用 72

5.3.1基于内容的音频检索 72

5.3.2音乐信号分析 73

5.3.3音频流的自动分割 74

5.4本章小结 76

第六章 多模态特征的综合分析 77

6.1底层异构特征间的内容鸿沟 78

6.2异构特征间的统计相关性挖掘 80

6.2.1数学模型 80

6.2.2多模态特征综合分析实例:图像和音频特征间的典型相关性分析 81

6.2.3技术特点 83

6.3实验测试和结果分析 83

6.3.1数据收集和特征提取 84

6.3.2实验环境和参数设置 85

6.3.3扩展实验 85

6.4本章小结 89

第三部分 多模态数据挖掘实例:跨媒体检索 95

第七章 跨媒体检索基础知识 95

7.1跨媒体的基本概念 96

7.1.1人脑对多模态信息的认知特性 96

7.1.2跨媒体数据挖掘的主要范畴 98

7.1.3跨媒体检索的重要意义 99

7.2跨媒体检索的相关研究与应用 100

7.2.1多特征的融合分析与挖掘 100

7.2.2跨媒体潜在关联挖掘 102

7.2.3跨语言检索 103

7.2.4视频中的说话人脸检测 105

7.2.5多媒体交叉索引技术 106

7.3本章小结 106

第八章 跨媒体检索系统的仿真实例 108

8.1基于子空间映射的多模态数据表达 108

8.2跨媒体距离的综合度量 110

8.3基于相关反馈的跨媒体检索结果优化 111

8.3.1算法描述 112

8.3.2算法分析 114

8.4新数据的引入 115

8.5实验测试和结果分析 116

8.5.1子空间维数的选取 117

8.5.2跨媒体检索结果 118

8.5.3相关反馈的实验结果 119

8.5.4扩展实验 120

8.6本章小结 123

第九章 基于隐性语义索引的跨媒体检索 124

9.1跨媒体的特征共生矩阵 124

9.1.1隐性语义索引 125

9.1.2视觉和听觉特征的共生估计 126

9.2相关性融合与优化算法 127

9.2.1形式化描述 127

9.2.2算法分析 128

9.3主动学习策略 129

9.3.1主动学习的概念 130

9.3.2候选集计算 131

9.3.3条件概率计算 132

9.3.4主动学习规则 132

9.4实验测试和结果分析 133

9.4.1矩阵秩的选取 134

9.4.2主动学习策略对检索性能的影响 135

9.4.3LSI-Active和CCA-Passive两种线性方法的性能对比 137

9.5本章小结 138

第十章 Web环境中的跨媒体数据挖掘 140

10.1基于Web的信息检索 140

10.2跨媒体关联图的建模过程 142

10.2.1预处理过程 143

10.2.2链接分析 143

10.2.3图模型的定义 144

10.3基于图模型的全局相关性推理 145

10.4跨媒体关联图的更新策略 147

10.5本章小结 148

第四部分 复杂数据环境下的多媒体语义挖掘 153

第十一章 复杂数据关系的非线性分析 153

11.1相关概念 153

11.1.1复杂数据关系 153

11.1.2非线性模型 154

11.2流形学习模型 155

11.2.1流形与流形学习 155

11.2.2经典的流形学习方法 157

11.3复杂数据关系的非线性流形建模 161

11.3.1多特征观测空间 162

11.3.2流形学习之:构造邻接图 163

11.3.3流形学习之:计算测地线距离和子空间坐标 165

11.4短期修正和长期修正策略 166

11.5增量学习能力探讨 168

11.5.1几何方法 168

11.5.2交互方法 169

11.6应用实例分析 170

11.6.1多模态检索 171

11.6.2图像和音频之间的跨媒体检索 172

11.6.3新数据的引入 173

11.7本章小结 175

第十二章 海量多媒体资源的网格化存储 177

12.1海量多媒体资源的存储问题 178

12.2网格相关知识 179

12.2.1定义和特征 179

12.2.2体系结构 180

12.2.3网格的类型 180

12.2.4网格资源管理 181

12.2.5相关应用项目 182

12.3仿真环境下的网格设计:以数字图书馆应用为例 183

12.3.1系统构架 183

12.3.2虚拟多媒体资源空间 186

12.3.3检索算法设计 187

12.3.4网格服务的发布和使用 189

12.4本章小结 192

附录 193

参考文献 229

后记 240