目录 1
第一章 语音识别的目的与内容概述 1
1.1语音识别的目的及内容安排总体思想 1
1.2语音识别系统基本结构及语音发音模型 2
1.3从实际需要提出的问题及解决问题的宏观思路与方法 4
1.4内容安排 6
第二章 特征提取及特征间的距离量度 7
2.1短时段(帧)能量类特征 7
2.2相对瞬时值类特征 8
2.3线性预测系数、预测误差及自相关系数特征 9
2.4一般带通滤波器组(BPFG)特征 18
2.5仿人耳听觉模型特征 19
2.6倒谱特征 31
2.7基音周期特征 36
2.8四声判别及其所用特征 42
2.9高阶信号谱类特征,WV谱特征 44
附录2.1 随采样时刻变换的ki特征(ki,n)计算式的推导 47
第三章 学习与识别方法 53
3.1起止点及S/U/V识别技术 54
3.2语音识别中的向量量化、聚类和VQ识别法 66
3.3VQ/HMM系统的基本原理和方法 76
3.4改进的VQ/HMM识别系统,MHMM及MSIHMM 80
3.5每状态的输出概率为连续分布时的HMM系统 85
3.6基于网络的识别系统 88
3.7基于时序特征差(声谱差)的动态时配识别系统 95
3.8基于动态时轴弯曲(DTW)的动态时配识别系统 98
3.9基于先验知识或规律的识别系统 103
3.10基于音素(符)的识别系统 105
3.11基于神经网络的识别法 108
第四章 多人的语音识别 113
4.1同音素多码字的VQ特征选取型 113
4.2DTW型的多人识别系统 114
4.3基于HMM的多人识别系统 120
4.4谱弯曲型(DSW)多人识别系统 129
4.5话者自适应模板参数型识别系统 131
4.6采用自学习模板优化的识别系统 132
第五章 噪声和干扰下的语音识别 134
5.1简单坚实型(ROBUST)方法 134
5.2利用接触型与对消型话筒的抗扰识别 135
5.3噪声下时帧谱幅度直接估计法,减谱型法 137
5.4自、互相关处理抗噪法 139
5.5非线性处理型方法 141
5.6线性滤波法,Weiner滤波法 142
5.7从抗噪观点选择优化特征的方法 147
5.8优化距离量度定义的抗噪识别系统 150
5.9自适应噪声干扰对消(ANC)降噪方法 152
5.10自适应信号增强型降噪系统 171
5.12用于DTW及HMM型识别系统的噪声补偿技术 175
5.11干扰对消及语音增强联合降噪系统 175
第六章 话者识别 180
6.1话者识别系统中的特征类型选取、优选准则和距离量度 180
6.2话者识别系统中的识别方法 185
第七章 语音识别系统的设计方略、步骤及实例 195
7.1语音识别系统的设计方略和步骤 195
7.2全汉语音节语音识别系统的设计方略和步骤 195
附录7.1 采用四种特征类型作识别时的试验结果数据 199
附录7.2 供设计二级识别用的剖析数据 204
附录7.3 主要参考程序 206
第八章 语音识别实时系统硬软件设计及实例 223
8.1系统的总体考虑及设计过程的拟定 223
8.2实时语音识别系统的应用软件开发 224
8.3实时语音识别系统的硬件设计及系统软件考虑 228
附录8.1 实时语音识别系统中的FFTTMS32010程序 232
附录8.2 实时语音识别系统主程序 252
参考文献 254