第1章 语音编码概论 1
1.1 引言 1
1.2 语音编码器的基本属性 2
1.2.1 语音质量 2
1.2.2 编码速率 4
1.2.3 编解码的复杂度 4
1.2.4 编解码延时 4
1.3 标准化的语音编码器 5
1.3.1 ITU-T语音编码标准 5
1.3.2 欧洲数字蜂窝电话标准 6
1.3.3 北美数字蜂窝电话标准 7
1.3.5 保密通信电话标准 8
1.3.4 日本数字蜂窝电话标准 8
1.3.6 卫星电话标准 9
1.3.7 语音编码器的性能比较 9
1.4 语音编码的发展方向 11
第2章 语音信号的数字模型 13
2.1 发音器官 13
2.1.1 肺和气管 13
2.1.2 喉 14
2.1.3 声道 15
2.2 语音产生过程 16
2.3 语音的声学特性 17
2.4 语音信号产生的数字模型 18
2.5 听觉器官和语音感知 19
2.5.1 听觉器官 19
2.5.2 语音感知 20
第3章 语音信号的数字分析 22
3.1 语音信号的数字化 22
3.1.1 取样和量化 22
3.1.2 语音信号的预处理及时域波形 25
3.2 短时平均能量、振幅和跨零数 29
3.2.1 短时平均能量 29
3.2.2 短时平均幅度函数 31
3.2.3 短时平均跨零数(过零率) 32
3.3 短时自相关函数 33
3.4 短时傅里叶变换(STFT) 35
3.4.1 傅里叶变换解释 35
3.4.2 滤波器解释 41
3.5.1 时域取样率 43
3.5 短时傅里叶变换的取样率 43
3.5.2 频域取样率 44
3.5.3 时域和频域总取样率 45
3.6 语音信号的短时综合 45
3.6.1 滤波器组相加法 45
3.6.2 叠接相加法 49
3.7 语音信号的语谱图分析 52
3.8 语音信号的倒谱分析 54
第4章 语音信号的基音检测 58
4.1 基音检测的现状 58
4.1.1 时域波形类似性方法 59
4.1.2 频域谱类似性方法 59
4.2 基音检测的预处理和后处理 60
4.2.1 谱平整 60
4.2.2 基音轨迹平滑 61
4.3 基于归一化互相关函数的基音检测算法 62
4.3.1 归一化互相关函数的确定 62
4.3.2 预处理 63
4.3.3 后处理 70
4.3.4 清浊判决 70
4.3.5 实验结果 71
4.4 基于MBE模型的基音检测算法 73
4.4.1 频域估计 73
4.4.2 时域近似估计 75
4.4.3 偏差校正 76
4.4.4 算法的实现 79
4.5 基于正弦模型的基音检测算法 86
4.5.1 算法的基本原理 86
4.5.2 改善性能的几种措施 89
4.5.3 短时谱包络估计 90
4.5.4 浊音度(voicing)检测 90
4.5.5 实验结果 91
第5章 语音信号的线性预测分析 93
5.1 线性预测分析的基本原理 93
5.1.1 LPA的实现方法 93
5.1.2 语音信号模型参数与线性预测误差滤波器参数之间的关系 95
5.2 线性预测分析的解法 97
5.2.1 自相关法 98
5.2.2 协方差法 101
5.2.3 格型法(或协格法) 106
5.3 线性预测分析的应用 109
5.3.1 LPA谱估计 109
5.3.2 语音信号LPA谱估计的实际考虑 111
5.3.3 基音检测 113
5.4 线谱频率分析 116
5.4.1 线谱频率参数的定义及性质 116
5.4.2 LSF参数与LPA系数间的相互转换 122
第6章 语音信号的矢量量化方法 128
6.1 矢量量化的基本原理 128
6.1.1 矢量量化的定义与矢量量化器的构造 128
6.1.2 最佳矢量量化器 131
6.1.3 矢量量化器的设计算法 132
6.2 矢量量化系统 135
6.2.1 全搜索矢量量化器 135
6.2.2 树搜索矢量量化器 137
6.2.3 多级矢量量化器 139
6.2.4 乘积码矢量量化器 142
6.3 有记忆的矢量量化系统 147
6.3.1 预测矢量量化器 147
6.3.2 有限状态矢量量化器 151
第7章 线性预测系数的有效量化方法 154
7.1 失真测度及客观评价 154
7.1.1 失真测度 154
7.1.2 客观评价指标 156
7.2 分裂式矢量量化 157
7.3 多级矢量量化 158
7.4 预测分裂式矢量量化 161
7.5 连接分裂式矢量量化 164
7.6 去除非典型胞腔 169
8.1 码激励线性预测语音编码模型 171
第8章 码激励线性预测语音编码 171
8.2 激励参数的优化原理 175
8.2.1 两级码书结构的CELP编码器 175
8.2.2 激励码书的联合优化和分级优化 177
8.2.3 激励参数优化的基本计算量 178
8.3 固定码书搜索算法 179
8.3.1 特殊设计的码书搜索算法 179
8.3.2 自相关算法 180
8.3.3 变换域算法 181
8.3.4 多级搜索算法 183
8.3.5 码字叠接递推算法 183
8.3.6 代数码书搜索算法 187
8.3.7 矢量和码书搜索算法 189
8.4.1 整数延时自适应码书的搜索 192
8.4 自适应码书搜索算法 192
8.4.2 分数延时自适应码书的搜索 194
8.5 激励码书增益的量化 200
8.5.1 增益的归一化矢量量化 201
8.5.2 增益的预测式矢量量化 202
8.6 自适应后滤波 203
8.6.1 短时后滤波器 203
8.6.2 长时后滤波器 205
8.6.3 组合的后滤波器 209
8.6.4 后滤波器的性能 210
8.7 CELP语音编码器实例 211
8.7.1 FS1016 4.8 kb/s CELP 212
8.7.2 G.728 16 kb/s LD-CELP 213
8.7.3 IS54 8 kb/s VSELP 214
8.7.4 JDC 3.6 kb/s PSI-CELP 216
8.7.5 G.729 8 kb/s CS-ACELP 217
第9章 波形内插语音编码 220
9.1 原型波形内插的基本思想 220
9.2 原型波形内插原理 221
9.2.1 瞬时波形及其内插 221
9.2.2 PCW波形动态的自适应 223
9.3 原型波形内插的实际实现 225
9.3.1 原型波形谱包络的修正 225
9.3.2 类似性测量 226
9.3.3 对齐(Alignment)和SCR 227
9.3.4 原型波形的量化 228
9.3.5 PW的内插 230
9.3.6 PWI和其它编码技术的过渡 231
9.4.1 在语音域中提取PW 232
9.4 原型波形的提取方法 232
9.4.2 在残差域中提取PW 233
9.5 PWI编码器性能分析 233
9.6 特征波形内插的基本原理 235
9.7 特征波形内插的分析模块 236
9.7.1 线性预测分析(LPA) 237
9.7.2 基音估计 237
9.7.3 基音内插 238
9.7.4 特征波形的表达 239
9.7.5 特征波形的提取 241
9.7.6 特征波形的对齐 242
9.7.7 特征波形的功率计算及归一化 248
9.8.1 瞬时基音周期和瞬时CW的生成 251
9.8 特征波形内插的合成模块 251
9.8.3 分析合成层的性能 254
9.8.2 相位轨迹估计 254
9.9 CWI编码器参数的量化 255
9.9.1 特征波形功率的量化 256
9.9.2 特征波形的量化 257
9.9.3 CWI编码器的性能 262
第10章 多带激励语音编码 263
10.1 MBE语音编、解码模型 263
10.2 MBE的语音分析 266
10.2.1 基频估计 266
10.2.2 清/浊判决 267
10.2.3 谐波幅度估计 269
10.3 MBE的语音合成 269
10.3.2 浊音语音合成 270
10.3.1 清音语音合成 270
10.3.3 重建语音的产生 272
10.4 MBE模型参数的量化 272
10.5 INMARSAT-M系统中的4.15 kb/s IMBE语音编码器 273
10.6 低比特率MBE语音编码器 275
10.6.1 MBE幅度的LPA谱逼近 275
10.6.2 一种基于LPA的2.4 kb/s MBE声码器 279
第11章 正弦语音编码 283
11.1 广义正弦分析与合成模型 283
11.2 STC语音编码 284
11.2.1 低速率STC语音编、解码原理 284
11.2.2 2.4/4.8 kb/s STC语音编码比特分配及性能比较 287
11.3.1 HELP语音编、解码原理 290
11.3 HELP语音编码 290
11.3.2 HELP语音编码关键技术 292
11.3.3 2.3 kb/s HELP语音编码比特分配及性能比较 294
第12章 混合激励线性预测语音编码 296
12.1 LPC语音合成模型 296
12.2 MELP语音合成模型及机理 297
12.2.1 混合的脉冲和噪声激励 297
12.2.2 周期或非周期脉冲 300
12.2.3 自适应谱增强 301
12.2.4 脉冲散布滤波器 303
12.2.5 残差谐波幅度模型 303
12.3 MELP编码器 305
12.3.1 参数分析与提取 305
12.3.2 参数量化与编码 309
12.4 MELP解码器 311
12.4.1 信道解码 312
12.4.2 增益抑制 312
12.4.3 参数插值 313
12.4.4 混合激励信号的生成 313
12.4.5 自适应谱增强 314
12.4.6 线性预测合成 314
12.4.7 增益调整 314
12.4.8 脉冲散布滤波 314
12.4.9 合成部分的循环控制 315
12.5 2.4kb/s MELP语音编码的比特分配与性能比较 315
参考文献 316