前言页 1
第一章 绪论 1
第二章 语音信号处理的基础知识 3
2.1 语音和语言 3
2.2 语音产生的过程及其声学特性 4
2.3 语音感知 5
2.4 语音信号的数字模型 6
2.5 语音信号的统计特性 12
2.6 语音特性分析实例 12
2.7 语音的质量评价 16
参考文献 17
3.1 概述 18
第三章 语音信号的时域分析 18
3.2 语音信号的数字化和预处理 19
3.3 短时能量分析 20
3.4 短时过零分析 24
3.5 短时相关分析 26
参考文献 33
第四章 语音信号的频域分析 34
4.1 概述 34
4.2 短时傅里叶变换 34
4.3 短时傅里叶变换的取样率 41
4.4 短时傅里叶反变换 42
4.5 语谱图 46
参考文献 47
5.2 同态信号处理的基本原理 48
5.1 概述 48
第五章 语音信号的同态分析 48
5.3 复倒谱和倒谱 50
5.4 语音信号的复倒谱 51
5.5 避免相位卷绕的算法 53
5.6 语音信号复倒谱分析实例 57
参考文献 60
第六章 语音信号的线性预测分析 61
6.1 概述 61
6.2 线性预测分析的基本原理 61
6.3 线性预测分析的解法 65
6.4 格型法 69
6.5 线性预测分析应用--LPC谱估计和LPC复倒谱 73
6.6 线谱对(LSP)分析 79
6.7 极零模型 81
参考文献 82
第七章 语音信号的矢量量化 83
7.1 概述 83
7.2 矢量量化的基本原理 83
7.3 失真测度 85
7.4 最佳矢量量化器和码本的设计 87
7.5 降低复杂度的矢量量化系统 90
7.6 语音参数的矢量量化 93
参考文献 94
第八章 隐马尔可夫模型(HMM) 96
8.1 概述 96
8.2 隐马尔可夫模型的引入 96
8.3 隐马尔可夫模型的定义 99
8.4 隐马尔可夫模型三项问题的求解 100
8.5 HMM的一些实际问题 102
参考文献 103
第九章 基音提取与共振峰估值 104
9.1 基音提取 104
9.2 共振峰估值 113
第十章 语音信号的波形编码 118
10.1 概述 118
10.2 语音信号的压缩编码原理 119
10.3 脉冲编码调制(PCM)及其自适应 120
10.4 预测编码及其自适应APC 123
10.5 自适应差分脉冲编码调制(ADPCM)及自适应增量调制(ADM) 126
10.6 子带编码(SBC) 129
10.7 自适应变换编码(ATC) 130
参考文献 133
第十一章 语音信号的参数编码--声码器技术 135
11.1 概述 135
11.2 相位声码器和通道声码器 136
11.3 同态声码器 140
11.4 线性预测声码器 142
11.5 新一代声码器 144
11.6 各种波形编码与声码器的比较 148
参考文献 150
第十二章 语音合成 152
12.1 概述 152
12.2 语音合成原理 153
12.3 共振峰合成 155
12.4 线性预测合成 158
12.5 专用语音合成硬件简介 160
参考文献 162
第十三章 语音识别 163
13.1 概述 163
13.2 语音识别原理 165
13.3 动态时间规整 167
13.4 有限状态矢量量化技术 169
13.5 孤立字(词)识别系统 172
13.6 连续语音识别 175
参考文献 177
第十四章 说话人识别 178
14.1 概述 178
14.2 特征选取 179
14.3 说话人识别系统的结构 181
14.4 说话人识别中的识别方法 182
参考文献 185
第十五章 语音增强 186
15.1 概述 186
15.2 语音特性、人耳感知特性及噪声特性 186
15.3 滤波器法语音增强 188
15.4 非线性处理语音增强 190
15.5 减谱法语音增强 191
15.6 自相关相减法语音增强 194
15.7 自适应对消语音增强 194
参考文献 196
汉英名词术语对照 198