第一章 绪论 1
第一节 说话人识别概述 2
一、背景及意义 2
二、说话人识别基本原理 3
第二节 说话人识别系统的研究与发展 6
第三节 说话人识别中的特征提取与分析 8
第四节 说话人识别中的识别方法 10
一、模板匹配法 10
二、统计概率模型法 11
三、人工神经网络 13
四、支持向量机法 13
第五节 性能评价 14
第六节 研究现状和难点 16
一、特征变换 17
二、鲁棒性说话人识别 18
第七节 研究工作概述与安排 21
一、工作内容 21
二、全书的组织结构 24
第二章 基于嵌入变换的多步聚类变换算法的说话人辨认 27
第一节 引言 27
第二节 基于高斯混合模型的说话人辨认 29
一、说话人辨认系统 29
二、高斯混合说话人模型 31
三、前端处理 33
四、MFCC参数 34
第三节 基于嵌入变换的对角方差高斯混合模型 35
一、嵌入变换的对角方差高斯混合模型参数 35
二、最大似然估计的EM算法 37
第四节 基于对角方差矩阵的多步聚类EM算法 39
一、基于对角方差矩阵的聚类EM算法 40
二、多步聚类算法及其步骤 43
第五节 实验语音库 46
第六节 实验操作 47
一、最小描述长度(MDL)比较实验 48
二、多步聚类说话人辨认实验 52
第七节 结论 57
第三章 基于加权特征补偿变换的鲁棒性说话人辨认 59
第一节 引言 59
第二节 前端处理 63
一、语音检测 64
二、噪声谱估计 66
三、谱减 66
四、帧信噪比与加权因子 67
第三节 加权特征补偿变换算法 70
一、加权算法 71
二、对帧似然概率的归一化补偿变换 72
三、加权特征补偿变换的提出 75
第四节 鲁棒说话人识别仿真系统 79
一、预处理和特征提取 79
二、高斯混合模型的建立与识别 80
第五节 仿真实验与结果分析 81
一、仿真系统语音库 81
二、加权因子仿真实验 82
三、基于加权特征补偿变换的说话人识别方法的仿真研究 84
第六节 结论 89
第四章 基于自适应直方图均衡化的鲁棒性说话人辨认研究 91
第一节 引言 91
第二节 直方图均衡化 96
一、直方图均衡化原理 96
二、分位差直方图均衡化法 101
三、数据拟合直方图均衡化 103
第三节 改进的自适应直方图均衡化 106
一、问题的提出 106
二、自适应直方图均衡化方法 109
第四节 鲁棒说话人辨认实验的建立 111
第五节 实验与结果分析 113
一、变换性能实验 114
二、效率比较实验 119
三、识别性能比较实验 121
第六节 结论 124
第五章 总结与展望 126
第一节 本研究工作总结 126
第二节 研究展望 130
参考文献 133