第一部分 引论 3
第1章 简介 3
1.1 多媒体数据挖掘定义 3
1.2 多媒体数据挖掘系统经典体系结构 6
1.3 本书内容与组织 7
1.4 本书受众 8
1.5 进一步读物 8
第二部分 理论和技术 13
第2章 多媒体数据特征与知识表示 13
2.1 引言 13
2.2 基本概念 14
2.2.1 数字采样 14
2.2.2 媒体数据类型 16
2.3 特征表示 18
2.3.1 统计特征 19
2.3.2 几何特征 23
2.3.3 元特征 26
2.4 知识表示 26
2.4.1 逻辑表示 26
2.4.2 语义网络 28
2.4.3 框架 29
2.4.4 约束 31
2.4.5 不确定性表示 33
2.5 小结 36
第3章 统计数据挖掘理论与技术 37
3.1 引言 37
3.2 贝叶斯学习 38
3.2.1 贝叶斯定理 38
3.2.2 贝叶斯最优分类器 40
3.2.3 Gibbs抽样算法 41
3.2.4 朴素贝叶斯分类器 41
3.2.5 贝叶斯信念网络 42
3.3 概率潜在语义分析 45
3.3.1 潜在语义分析 46
3.3.2 潜在语义分析概率扩展 47
3.3.3 基于期望最大化的模型拟合 48
3.3.4 潜在概率空间与概率潜在语义分析 49
3.3.5 模型过拟合与强化的期望最大化算法 50
3.4 用于离散数据分析的隐含狄利克雷分配模型 51
3.4.1 隐含狄利克雷分配模型 52
3.4.2 与其他隐变量模型关系 54
3.4.3 隐含狄利克雷分配模型推理 56
3.4.4 隐含狄利克雷分配模型参数估计 58
3.5 层次狄利克雷过程 58
3.6 多媒体数据挖掘中的应用 60
3.7 支持向量机 60
3.8 面向结构化输出空间的最大间隔学习 65
3.9 Boosting 70
3.10 多示例学习 72
3.10.1 构建语义词空间与图像视觉代表对象空间映射 73
3.10.2 词到图像的查询 76
3.10.3 图像到图像的查询 76
3.10.4 图像到单词的查询 76
3.10.5 多模态查询 77
3.10.6 可扩展性分析 77
3.10.7 适应性分析 77
3.11 半监督学习 80
3.11.1 监督学习 83
3.11.2 半监督学习 84
3.11.3 半参数正则化最小二乘 87
3.11.4 半参数正则化支持向量机 88
3.11.5 半参数正则化算法 90
3.11.6 直推方法与半监督学习 91
3.11.7 与其他方法的比较 91
3.12 小结 92
第4章 基于软计算的理论与技术 93
4.1 引言 93
4.2 软计算方法特点 94
4.3 模糊集理论 95
4.3.1 模糊集基本概念和性质 95
4.3.2 模糊逻辑和模糊推理规则 97
4.3.3 模糊集在多媒体数据挖掘中的应用 98
4.4 人工神经网络 99
4.4.1 神经网络基本结构 99
4.4.2 神经网络中的监督学习 102
4.4.3 神经网络中的强化学习 106
4.5 遗传算法 109
4.5.1 遗传算法简述 109
4.5.2 遗传算法极值搜索与传统极值搜索方法比较 112
4.6 小结 116
第三部分 多媒体数据挖掘应用实例 119
第5章 图像数据库建模——语义库训练 119
5.1 引言 119
5.2 研究背景 119
5.3 相关工作 120
5.4 图像特征和视觉词典 122
5.4.1 图像特征 122
5.4.2 视觉词典 123
5.5 α-语义图与语义库模糊模型 125
5.5.1 α-语义图 126
5.5.2 语义库模糊模型 128
5.6 基于分类的检索算法 129
5.7 实验结果 131
5.7.1 给定数据库上的分类性能 132
5.7.2 基于分类的检索结果 133
5.8 小结 138
第6章 图像数据库建模——潜在语义概念发现 139
6.1 引言 139
6.2 研究背景和相关工作 139
6.3 基于区域的图像表示 141
6.3.1 图像分割 142
6.3.2 视觉符号目录 144
6.4 概率潜在语义模型 147
6.4.1 概率数据库模型 147
6.4.2 使用期望最大化构建模型 148
6.4.3 概念数估计 149
6.5 基于后验概率的图像挖掘与检索 150
6.6 算法分析 152
6.7 实验结果 153
6.8 小结 160
第7章 图像数据挖掘和概念发现的多模态方法 161
7.1 引言 161
7.2 研究背景 161
7.3 相关工作 162
7.4 概率语义模型 163
7.4.1 概率语义标注图像模型 164
7.4.2 基于期望最大化的模型拟合过程 165
7.4.3 概念数估计 166
7.5 基于模型的图像语义标注与多模态图像挖掘和检索 167
7.5.1 图像语义标注与图像到文本查询 167
7.5.2 文本到图像查询 168
7.6 实验 169
7.6.1 数据库与特征集合 169
7.6.2 评估度量 170
7.6.3 图像自动语义标注结果 171
7.6.4 单个文本到图像的查询结果 173
7.6.5 图像到图像的查询结果 174
7.6.6 与纯文本查询方法的性能比较结果 175
7.7 小结 176
第8章 视频数据库概念发现与挖掘 177
8.1 引言 177
8.2 研究背景 177
8.3 相关工作 178
8.4 视频分类 180
8.4.1 朴素贝叶斯分类器 180
8.4.2 最大熵分类器 182
8.4.3 支持向量机分类器 183
8.4.4 基于元数据与基于内容的分类器组合 184
8.5 查询分类 185
8.6 实验 186
8.6.1 数据集 186
8.6.2 视频分类结果 188
8.6.3 查询分类结果 193
8.6.4 查找相关性结果 193
8.7 小结 194
第9章 音频数据库概念发现与挖掘 196
9.1 引言 196
9.2 研究背景与相关工作 196
9.3 特征抽取 199
9.4 分类方法 201
9.5 实验结果 202
9.6 小结 205
参考文献 206