第一篇 语音信号处理基础 1
第一章 绪论 1
1.1 语音信号处理概述 1
1.2 语音信号处理的发展概况 3
1.3 本书的内容 5
第二章 语音信号处理的基础知识 6
2.1 概述 6
2.2 语音产生的过程 6
2.3 语音信号的特性 9
2.4 语音信号产生的数字模型 15
2.5 语音感知 21
第二篇 语音信号分析 23
第三章 语音信号的时域分析 23
3.1 概述 23
3.2 语音信号的数字化和预处理 24
3.3 短时能量分析 27
3.4 短时过零分析 31
3.5 短时相关分析 34
第四章 语音信号的短时傅里叶分析 40
4.1 概述 40
4.2 短时傅里叶变换 40
4.3 短时傅里叶变换的取样率 47
4.4 语音信号的短时综合 49
4.5 语谱图 53
第五章 语音信号的同态滤波及倒谱分析 55
5.1 概述 55
5.2 同态信号处理的基本原理 55
5.3 复倒谱和倒谱 57
5.4 语音信号两个卷积分量复倒谱的性质 58
5.5 避免相位卷绕的算法 60
5.6 语音信号复倒谱分析实例 65
第六章 语音信号的线性预测分析 69
6.1 概述 69
6.2 线性预测分析的基本原理 69
6.3 线性预测方程组的建立 72
6.4 线性预测分析的解法(一)——自相关法和协方差法 73
6.5 线性预测分析的解法(二)——格型法 78
6.6 线性预测分析应用——LPC谱估计和LPC复倒谱 83
6.7 线谱对(LSP)分析 88
6.8 极零模型 90
第七章 语音信号的矢量量化 93
7.1 概述 93
7.2 矢量量化的基本原理 94
7.3 失真测度 96
7.4 最佳矢量量化器和码本的设计 98
7.5 降低复杂度的矢量量化系统 101
7.6 语音参数的矢量量化 105
第八章 隐马尔可夫模型(HMM) 107
8.1 概述 107
8.2 隐马尔可夫模型的引入 108
8.3 隐马尔可夫模型的定义 110
8.4 隐马尔可夫模型三项问题的求解 112
8.5 HMM的一些实际问题 114
第九章 语音检测分析 116
9.1 基音检测 116
9.2 共振峰估值 126
第三篇 语音信号处理技术与应用 134
第十章 语音编码(一)——波形编码 134
10.1 概述 134
10.2 语音信号的压缩编码原理 135
10.3 脉冲编码调制(PCM)及其自适应 137
10.4 预测编码及其自适应APC 141
10.5 自适应差分脉冲编码调制(ADPCM)及自适应增量调制(ADM) 144
10.6 子带编码(SBC) 146
10.7 自适应变换编码(ATC) 149
第十一章 语音编码(二)——声码器技术及混合编码 152
11.1 概述 152
11.2 声码器的基本结构 153
11.3 相位声码器和通道声码器 154
11.4 同态声码器 157
11.5 线性预测声码器 160
11.6 混合编码 162
11.7 各种语音编码方法的比较 167
11.8 语音编码的性能指标和质量评价 169
第十二章 语音合成 172
12.1 概述 172
12.2 语音合成原理 174
12.3 共振峰合成 176
12.4 线性预测合成 180
12.5 专用语音合成硬件及语音合成器芯片 182
第十三章 语音识别 186
13.1 概述 186
13.2 语音识别原理 189
13.3 动态时间规整 191
13.4 有限状态矢量量化技术 194
13.5 孤立词识别系统 197
13.6 连续语音识别 200
第十四章 说话人识别 205
14.1 概述 205
14.2 特征选取 206
14.3 说话人识别系统的结构 208
14.4 说话人识别中的识别方法 209
第十五章 语音增强 213
15.1 概述 213
15.2 语音特性、人耳感知特性及噪声特性 214
15.3 滤波器法 215
15.4 非线性处理 218
15.5 减谱法 219
15.6 自相关相减法 221
15.7 自适应噪声对消 222
15.8 基于子波分析技术的语音增强简介 225
第十六章 人工神经网络在语音信号处理中的应用 227
16.1 概述 227
16.2 神经网络的基本概念 228
16.3 神经网络的模型结构 230
16.4 语音信号处理中神经网络与传统方法的结合 234
16.5 神经网络语音合成 237
16.6 神经网络语音识别 238
16.7 神经网络说话人识别 241
16.8 神经网络语音增强 242
参考文献 244
汉英名词术语对照 249