第1章 绪论 1
1.1 概述 1
1.2 语音编码的应用 1
1.3 语音编码的分类 2
1.3.1 按编码方法分类 2
1.3.2 按编码速率分类 3
1.3.3 按编码语音带宽分类 3
1.3.4 按编码信号所在域分类 3
1.4 语音编码的硬件与系统 4
1.5 语音编码的发展趋势 4
1.6 全书的组织 5
参考文献 5
第2章 语音编码的声学基础 6
2.1 语音信号的时域波形 6
2.2 语音的产生机理与模型 7
2.2.1 肺与喉 8
2.2.2 声道 9
2.2.3 语音信号的产生模型 9
2.3 语音信号的声学特性 10
2.3.1 语音信号的分类 10
2.3.2 基音与四声 11
2.4 人耳听觉特性 12
2.4.1 正常人的听域与听阈 12
2.4.2 响度级(Loudness Level)和响度(Loudness) 12
2.4.3 音调 14
2.4.4 掩蔽效应(Masking Effect) 14
2.4.5 言语听觉 15
参考文献 17
第3章 语音编码中的数字分析技术 18
3.1 短时分析技术基础 18
3.1.1 预滤波、采样、A/D变换 18
3.1.2 存储和加窗 18
3.2 短时能量、短时平均幅度和短时过零率 19
3.3 短时自相关函数和短时频谱 19
3.4 短时基音周期分析 21
3.5 语谱图分析 24
3.6 线性预测分析 25
3.6.1 线性预测分析的基本概念 26
3.6.2 线性预测分析的求解 29
3.6.3 德宾(Durbin)递推算法 31
3.6.4 LPC模型阶数P和激励增益G的确定 40
3.7 各种LPC参数以及它们之间的关系 41
参考文献 48
第4章 语音编码中的矢量量化技术 49
4.1 概述 49
4.2 矢量量化的基本原理 49
4.2.1 矢量量化的定义 49
4.2.2 矢量量化的评价指标 51
4.2.3 矢量量化的关键技术 52
4.3 矢量量化器 53
4.3.1 穷尽搜索矢量量化器 53
4.3.2 多级矢量量化器 53
4.3.3 分裂矢量量化器 55
4.3.4 分类矢量量化器 56
4.3.5 形状-增益矢量量化器 57
4.3.6 预测矢量量化器 58
4.3.7 有限状态矢量量化器 59
4.4 矢量量化的码本设计 60
4.4.1 LBG算法 60
4.4.2 模拟退火码本设计算法 62
4.4.3 其他码本设计算法 63
4.5 矢量量化的码字搜索 63
4.5.1 部分失真搜索算法 64
4.5.2 基于不等式的快速搜索算法 64
4.5.3 带有时变加权的快速搜索算法 67
4.6 矢量量化的码字索引分配 70
4.6.1 基于BSA的码字分配算法 70
4.6.2 基于模拟退火的码字分配算法 71
4.7 LSF参数的矢量量化 71
4.7.1 P-MSMQ算法 72
4.7.2 带有级问预测的多级矩阵量化算法 74
4.7.3 带有级间预测的多级码本联合优化 76
4.8 多参数多模式码本尺寸联合调整 78
4.8.1 矢量参数多模式量化 78
4.8.2 参与码本尺寸联合调整的参数 79
参考文献 84
第5章 语音编码的评价指标 86
5.1 评价语音编码的考虑要素 86
5.1.1 说话人和语种 86
5.1.2 信号能量 87
5.1.3 背景噪声 87
5.1.4 多次转接 88
5.1.5 信道误码 88
5.1.6 非语音信号 88
5.2 语音编码的主观测量 89
5.2.1 音质评价方法 89
5.2.2 可懂度评价方法 90
5.3 语音编码的客观测量 90
5.3.1 信噪比与谱失真 90
5.3.2 PSQM与PESQ 91
5.4 语音编码的复杂度和时延 91
参考文献 92
第6章 语音信号的波形编码 94
6.1 语音信号的标量量化 94
6.1.1 均匀量化 96
6.1.2 非均匀量化 98
6.1.3 自适应量化 105
6.2 自适应差分脉冲编码 110
6.2.1 DPCM的工作原理 110
6.2.2 自适应预测 114
6.2.3 CCITT G721高质量32 kb/s ADPCM 116
6.2.4 镶嵌式ADPCM 122
6.3 变换域编码 124
6.3.1 概述 124
6.3.2 最佳正交变换——KLT 130
6.3.3 离散余弦变换(DCT) 132
6.3.4 自适应比特分配 134
参考文献 136
第7章 语音信号的参数编码 138
7.1 线性预测编码的基本原理 138
7.2 LPC-10声码器 139
7.3 LPC-10e声码器 144
7.3.1 激励源的改善 144
7.3.2 基音提取方法的改进 147
7.3.3 声道滤波器参数量化的改进 147
7.3.4 LSF参数的矢量量化 148
7.4 本章小结 149
参考文献 149
第8章 语音信号的混合编码 151
8.1 混合编码的基本原理 151
8.1.1 合成分析法ABS(Analysis By Synthesis) 151
8.1.2 感觉加权滤波器 151
8.1.3 中、低速率混合编码 153
8.2 多脉冲及规则脉冲激励线性预测声码器(MPLPC及RPE-LPC) 154
8.2.1 多脉冲线性预测声码器 154
8.2.2 规则脉冲激励线性预测声码器(RPE-LPC) 158
8.3 码激励线性预测声码器(CELP) 168
8.3.1 CELP编码算法 168
8.3.2 CELP码本搜索算法 169
8.3.3 美国政府标准4.8 kb/s CELP声码器FED-STD-1016 170
8.3.4 美国EIA/TIA 8 kb/s VSELP声码器 173
8.3.5 16 kb/s短延时码激励线性预测(LD-CELP)声码器 178
参考文献 183
第9章 低速率语音编码 185
9.1 波形插值编码 185
9.1.1 波形插值编码原理 186
9.1.2 特征波形的提取 186
9.1.3 特征波形的描述 186
9.1.4 特征波形的对齐 188
9.1.5 特征波形的量化 189
9.1.6 特征波形的重建和线性预测合成 190
9.2 正弦变换编码 192
9.2.1 STC编码参数的提取 192
9.2.2 STC编码合成算法 194
9.2.3 正弦变换的低速率编码模型 195
9.3 混合激励线性预测编码 196
9.3.1 MELP编码器原理 196
9.3.2 MELP编码参数量化 199
9.3.3 MELP解码器原理 201
9.3.4 MELPe算法 204
9.4 正弦激励编码 204
9.4.1 SELP编码器原理 204
9.4.2 SELP模型参数分析算法 205
9.4.3 SELP解码器原理 207
9.5 多带激励编码 209
9.5.1 多带激励语音模型 209
9.5.2 多带激励语音模型参数的提取 210
9.5.3 多带激励语音合成 217
9.6 极低速率语音编码 219
9.6.1 速率在400~1200 b/s左右的编码技术 220
9.6.2 速率在150~300 b/s左右的编码技术 223
9.7 低速率语音编码展望 224
参考文献 225
第10章 宽带语音编码 228
10.1 概述 228
10.2 子带编码 229
10.2.1 子带编码工作原理 229
10.2.2 子带编码的比特分配 231
10.2.3 整数带滤波器组 233
10.2.4 正交镜像滤波器组 235
10.3 G.722宽带语音编码 238
10.3.1 G.722编码器原理 239
10.3.2 G.722解码器原理 240
10.4 频带扩展(BWE)技术 242
10.5 联合语音音频编码(USAC) 244
10.5.1 USAC的组合型算法 244
10.5.2 USAC的统一型算法 245
10.6 宽带语音编码展望 246
参考文献 246
第11章 变速率语音编码 247
11.1 变速率语音编码的发展现状 247
11.2 变速率语音编码的相关技术 248
11.2.1 语音端点检测技术(VAD) 248
11.2.2 速率判决技术 252
11.2.3 差错隐藏技术 253
11.2.4 舒适噪声生成技术 256
11.3 AMR变速率语音编码 259
11.3.1 AMR编码器原理 259
11.3.2 AMR参数表示及量化 263
11.3.3 AMR解码器原理 269
11.3.4 AMR帧结构 272
11.4 变速率语音编码展望 272
参考文献 273
第12章 嵌入式语音编码 274
12.1 概述 274
12.2 嵌入式语音编码的发展现状 275
12.3 嵌入式语音编码的有关理论 275
12.3.1 设计理念与编码器的最优性 276
12.3.2 分层矢量量化 278
12.4 嵌入式语音编码的实现 279
12.4.1 嵌入式DPCM编码 279
12.4.2 嵌入式CELP编码 280
12.4.3 现有的CELP编码的嵌入式扩展 281
12.4.4 嵌入式参数量化 282
12.5 嵌入式语音编码标准G.729.1 282
12.5.1 G.729.1编码器原理 283
12.5.2 G.729.1解码器原理 287
12.5.3 G.729.1性能分析 287
12.5.4 G.729.1应用:宽带电话系统 288
12.6 嵌入式语音编码在网络中的应用要素 289
12.6.1 伸缩性的实现和利用 289
12.6.2 非等重错误保护及加密 291
12.7 嵌入式语音编码展望 291
参考文献 292
第13章 语音编码的关联技术 293
13.1 语音增强 293
13.1.1 语音增强算法的基本原理与分类 293
13.1.2 基于短时谱估计的语音增强算法 294
13.2 回声抵消 298
13.2.1 电学回声抵消 299
13.2.2 声学回声抵消 300
13.2.3 回声抵消中的语音检测 302
13.3 语音通信的同步 303
13.3.1 帧同步系统 303
13.3.2 帧同步系统的进一步改进 306
13.4 语音通信的抗信道误码方案 306
13.4.1 信道编码 307
13.4.2 差错检测与恢复 313
13.5 网络语音通信的抗丢包方案 315
13.5.1 语音算法的丢包鲁棒性 316
13.5.2 多描述语音编码 316
13.5.3 滑动窗算法 317
13.5.4 交织及前向纠错技术 318
13.5.5 丢包隐藏技术 318
13.6 本章小结 318
参考文献 318
第14章 语音编码系统的硬件实现 320
14.1 概述 320
14.2 数字信号处理器 320
14.3 基于DSP的语音编码系统设计 321
14.3.1 TMS320C54X/55X系列数字处理芯片 322
14.3.2 语音编码系统硬件平台的组成 322
14.3.3 硬件平台的音频接口电路 323
14.3.4 硬件平台的控制电路 324
14.3.5 语音编码系统低功耗设计 327
14.4 DSP开发工具与开发环境 328
14.4.1 DSP开发工具 328
14.4.2 DSP开发环境 329
14.5 DSP软件编程技巧 329
14.5.1 DSP软件定点化 329
14.5.2 DSP软件优化 332
参考文献 334
第15章 语音编码的标准 335
15.1 语音编码的国际标准 335
15.2 语音编码的区域或行业标准 337
15.2.1 北美标准化组织 337
15.2.2 欧洲标准化组织 338
15.2.3 日本标准化组织 339
15.2.4 中国标准化组织 340
15.2.5 第三代合作伙伴计划(3GPP,3GPP2) 340
15.2.6 国际海事卫星组织 341
15.2.7 保密通信标准 342
15.3 VOIP中应用的语音编码算法 342
15.3.1 iLBC算法 343
15.3.2 iSAC算法 343
15.3.3 Speex算法 344
15.3.4 SILK算法 344
参考文献 345