《智能环境下基于音视频多模态融合的身份识别》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:吴迪著
  • 出 版 社:天津:天津科学技术出版社
  • 出版年份:2018
  • ISBN:9787557645991
  • 页数:210 页
图书介绍:本书从特征提取、识别算法和融合规则三个方面对视听信息融合身份识别进行了研究,以便为智能环境下的视听信息识别提供可行的解决方案。本书的重点不仅包括基于视听信息融合的身份识别主要局限于理想环境下的单模态识别以及在现有融合方法上音视频特征的简单融合,还对于复杂环境下单模态生物特征的有效提取、高精度高普适性识别算法的构造与音视频特征在不同融合层级最优融合算法的确定进行了阐述。本书适合自动化专业的学生和老师参考和学习。

第1章 概述 1

1.1课题的背景和研究意义 1

1.2智能环境简介 3

1.3国内外研究现状 6

1.4智能环境下基于视听信息融合身份识别的研究难点 13

1.5本书主要工作和结构安排 15

第2章 智能环境下音视频融合的基本方法与进展 24

2.1音视频信息融合的基本方法 25

2.2基于任务的音视频融合方法比较 31

2.3存在的问题和发展方向 38

第3章 高鉴别能力人脸和语音特征提取研究 50

3.1引言 50

3.2基于鉴别能力分析的人脸DCT特征提取 50

3.3基于Gammatone滤波器的静动态语音听觉特征提取 60

3.4本章小结 64

第4章 基于DCT系数和非线性子空间的人脸识别 67

4.1引言 67

4.2基于核相关权重鉴别分析的多特征融合人脸识别 67

4.3基于核鉴别局部保持投影的多特征融合人脸识别 76

4.4本章小结 85

第5章 基于局部定向模式与深度神经网络的人脸识别 87

5.1引言 87

5.2基于显著性局部定向模式和深度学习的鲁棒人脸识别 87

5.3基于显著性差值局部定向模式和深度卷积网络的鲁棒人脸识别 95

5.4本章小结 104

第6章 基于静动态听觉特征融合与模型补偿的说话人识别 106

6.1引言 106

6.2基于静动态听觉特征融合与自适应GMM的说话人识别 106

6.3基于改进的局部保持投影的i-vector说话人识别 111

6.4本章小结 115

第7章 基于音视频信息决策级融合的多模态身份识别 118

7.1引言 118

7.2基于群体决策和多准则选择融合的证据组合方法 118

7.3基于多义度和三角模算子的加权冲突证据组合 132

7.4基于三角模与均方欧氏距离的加权证据组合 136

7.5基于证据信息散度的冲突证据表示 139

7.6本章小结 142

第8章 基于音视频信息多层级融合的多模态身份识别 145

8.1引言 145

8.2基于TER和不确定度量的匹配层融合算法 145

8.3基于高斯概率权值求解的逻辑回归排序层融合算法 149

8.4基于信任度函数和三角模的融合算法 153

8.5基于TER和特征关联自适应的融合算法 156

8.6实验分析 159

8.7本章小结 178

第9章 基于多特征融合的视频目标跟踪 182

9.1引言 182

9.2基于混合迭代无迹粒子滤波和关联系数自适应融合的视频目标跟踪 182

9.3基于视觉场景复杂度多特征自适应融合的目标跟踪 195

9.4本章小结 204

第10章 结论与展望 207