前言页 1
上篇 1
1 绪论 1
1.1 语音分析与合成 2
1.2 语音识别和理解 2
1.3 语音编码 3
2 语音学与语音信号模型 4
2.1 语音的发音机理 4
2.2 语音的听觉机理 6
2.3 语音信号模型 8
2.4 汉语语音特性 15
13.2 双片C31全双工实时实现16kbit/s LD-CELP语音编码器 22
3.1 短时时域分析 23
3 语音信号短时分析法 23
3.2 短时频域分析 29
3.3 语音信号同态处理 44
4 语音信号线性预测分析 55
4.1 线性预测分析的基本原理 55
4.2 线性预测方程组的解法 61
5 矢量量化 65
5.1 矢量量化基本原理 66
5.2 最佳矢量量化器 70
5.3 矢量量化器的设计算法 71
5.4 降低复杂度的矢量量化系统 75
6 语音合成 78
6.1 语音合成原理 78
6.2 共振峰合成 82
6.3 线性预测合成 90
6.4 汉语按规则合成 92
7.1 概述 98
7 语音识别 98
7.2 动态时间规整 99
7.3 隐马尔柯夫模型 104
8 语音编码 111
8.1 语音编码器的分类及特性 111
8.2 脉冲编码调制(Pulse Code Modulation-PCM) 114
8.3 自适应预测编码(Adaptive Predictive Coding-APC) 119
8.4 差分脉冲编码调制 121
8.5 线性预测声码器(LPC Vocoder) 127
下篇 132
9 概述 132
10 线性预测编码的改进方案 138
10.1 参数分析的改进 138
10.2 激励模型的改进 146
10.3 多脉冲激励线性预测编、解码器 147
10.4 规则脉冲激励线性预测编码器 151
10.5 码激励线性预测声码器(CELP) 158
10.6 4.8kb/s CELP算法(FS-1016) 164
11 ITU-T G.728标准:16kbit/s LD-CELP语音编码 175
11.1 16kbit/s LD-CELP语音编码技术综述 175
11.2 16kbit/s LD-CELP语音编码算法 179
11.3 16kbit/s LD-CELP语音编码的计算机模拟实现 187
12 改进的G.728算法 195
12.1 概述 195
12.2 码书优化 195
12.3 增益偏移自适应原理 204
12.4 短时预测器阶数的降低 210
12.5 最佳增益预测器的探讨 216
13 改进G.728算法的实时实现研究 219
13.1 双片C31系统结构 219
14 ITU-T G.729标准:8kbit/s CS-ACELP语音编码简介 231
14.1 G.729编码器比特分配 231
14.2 CS-ACELP编码器、解码器原理 232
14.3 加窗 233
14.5 开环基音分析 234
14.4 感觉加权滤波器 234
14.6 自适应码书搜索 235
14.7 固定码书结构 236
14.8 解码器原理 237
附录A:ITU-T G.728标准16kbit/s LD-CELP语音编码 239
1. 概述 239
2. LD-CELP概述 239
3. LD-CELP编码原则 241
4. LD-CELP解码原理 256
5. 计算细节 262
附件A 293
附件B 296
附件C 300
附件D 302
附件E 302
附件 F 304
附录B:ITU-T G.729标准8kbit/s CS-ACELP语音编码 305
1. 引言 305
2. 编码器简要说明 306
3. 编码器性能说明 311
4. 解码器的性能描述 329
参考文献 338