第一章 绪论 3
1.1 语音处理技术的发展概况 3
1.2 语音信号处理的应用 8
第二章 语音学概要 11
2.1 语音声学基础 11
2.2 语音的感知 16
2.3 语音的产生 24
2.4 元音 35
2.5 辅音 38
2.6 汉语音节 44
第三章 语音信号的时域处理方法 51
3.1 语音信号及其数字化 51
3.2 语音信号的时间依赖处理 51
3.3 短时能量和短时平均幅度 54
3.4 短时平均过零率 54
3.5 语音端点检测 56
3.6 短时自相关函数 58
3.7 短时平均幅度差函数 59
3.8 基音周期估计方法 60
第四章 语音信号频谱分析 67
4.1 短时傅里叶变换的定义和物理意义 67
4.2 基于短时傅里叶变换的语谱图及其时频分辨率 68
4.3 基于短时傅里叶变换的信号重构 71
4.4 基音同步分析法 79
4.5 复倒谱和倒谱 83
4.6 语音信号的倒谱分析与同态解卷积 88
第五章 语音信号线性预测原理 97
5.1 线性预测的基本原理 97
5.2 线性预测方程组的解法 100
5.3 线性预测的频域解释 107
5.4 线性预测的几种推演参数 108
5.5 线谱对分析法 112
5.6 基于线性预测参数的声道滤波器的实现 115
6.1 时频分布理论和语音信号的时频表示 120
第六章 语音信号的表示与谱失真测度 120
6.2 小波理论及其在语音处理中的应用 132
6.3 语音信号的参数表示及其失真测度 135
6.4 矢量量化技术及其在语音处理中的应用 148
第七章 语音识别 154
7.1 语音识别系统 154
7.2 语音识别中的特征提取及谱失真测度 160
7.3 矢量量化技术在语音识别中的应用 161
7.4 模板匹配法 164
7.5 隐马尔可夫模型技术 172
7.6 连接词语音识别系统 191
7.7 大词汇量连续语音识别系统 197
7.8 说话人自适应技术 212
7.9 关键词检出 223
7.10 语音理解 228
7.11 人工神经网络技术在语音识别中的应用 233
8.1 说话人识别的基本原理和应用 249
第八章 说话人识别和语种辨识 249
8.2 说话人识别的特征选择 254
8.3 说话人识别的主要方法 256
8.4 语种辨识的原理和应用 261
第九章 语音合成 266
9.1 语音合成方法 266
9.2 汉语语音的按规则合成 278
10.1 不依赖模型假定的语音编码方法 284
第十章 语音编码 284
10.2 基于模型假定的语音编码方法 297
10.3 极低速率语音编码技术 323
10.4 语音编码器的性能指标和评测方法 328
10.5 语音质量评价 331
附录 340
1.语音基音检测子程序 340
2.语音信号线性预测分析子程序 345
3.基于线性预测的倒谱系统计算子程序 347
4.Viterbi算法子程序 348