当前位置:首页 > 工业技术
数字语音-语音编码实用教程
数字语音-语音编码实用教程

数字语音-语音编码实用教程PDF电子书下载

工业技术

  • 电子书积分:13 积分如何计算积分?
  • 作 者:李昌立,吴善培编著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2004
  • ISBN:7115124221
  • 页数:373 页
图书介绍:本书介绍语音编码的国际标准中的关键算法和技术,以及相应的基础知识、计算方法、实验与应用。
《数字语音-语音编码实用教程》目录

目录 1

第1章 语音编码概论 1

1.1 语音编码的数字化 1

1.2 语音编码的必要性和推动力 1

1.3 语音编码的声学基础知识 3

1.3.1 响度级和响度 3

1.3.2 听觉掩蔽和临界频带 4

1.3.3 听觉掩蔽在语音编码中的作用 6

1.3.4 发声器官的声电类比线路 7

1.3.5 语言发声的数学模型 10

1.4 语音信号的物理特性 15

1.4.1 语音信号在时域和频域的特性 15

1.4.2 语音信号的统计特性 17

1.4.3 语音传输所需比特率的估计 19

1.5 除去语音冗余度的方法 21

1.6 语音编码器方案的分类 23

1.6.1 波形近似语音编码器 23

1.6.2 参量编码器 24

1.7 语音编码的发展趋势 24

参考文献 25

第2章 语音信号的采样和量化 27

2.1 采样 27

2.2 标量量化 28

2.2.1 量化误差 29

2.2.2 均匀量化器 30

2.2.3 最佳量化器 31

2.2.4 对数量化器 32

2.2.5 自适应量化器 33

2.2.6 差分量化器 35

2.3 矢量量化 37

2.3.1 失真测度 38

2.3.2 码书设计 39

2.3.3 码书种类 40

2.3.4 训练试验和码书的顽健性 45

参考文献 46

第3章 语音信号的分析和建模 48

3.1 短时频谱分析 48

3.1.1 窗的作用 49

3.2 语音信号的线性预测模型 53

3.2.1 语音产生的源滤波器模型 54

3.2.2 线性预测分析(LPA)的求解 55

3.2.3 线性预测分析的实现和物理解释 62

3.3.1 语音信号的周期性 64

3.3 音调预测 64

3.3.2 音调预测器 65

3.4 音调检测 68

3.4.1 时域波形的相似性方法 69

3.4.2 频率域频谱的相似性方法 72

3.4.3 预处理和后处理技术 74

参考文献 79

第4章 使用线谱频率(LSF)量化线性预测编码(LPC)参量 82

4.1 LPC参量的编码 82

4.2 LPC参量的另外一种表示——PARCOR系数 82

4.3 LPC到LSF的变换 87

4.3.1 LSF的计算 88

4.3.2 LSF到LPC的变换 95

4.3.3 LSF的特性 96

4.4.1 SIVP编码方案 98

4.4 转换型——自适应帧间矢量预测(SIVP) 98

4.4.2 矢量预测器 99

4.4.3 预测误差的量化 100

4.4.4 性能的比较 102

4.4.5 实时实现中的问题 105

4.5 SAVQ编码方案 107

4.5.1 SAVQ系统 107

4.5.2 性能比较 107

4.6 无记忆的LSF量化 109

4.6.1 LSF的分裂矢量量化 109

4.6.2 非均匀的标量量化 109

参考文献 111

第5章 按合成分析法(AbS)的语音编码方案 112

5.1 按合成分析法(AbS)的基本原理 112

5.2 通用的AbS编码方案 113

5.2.1 时变滤波器 114

5.2.2 建立在理解上的最小化程序 115

5.2.3 激励信号 116

5.2.4 最佳激励序列的确定 118

5.2.5 AbS-LPC方案的特性 121

5.3 多脉冲激励线性预测编码(MPLPC) 124

5.3.1 MPLPC的最优幅度激励 125

5.3.2 具有长期预测的MPLPC 127

5.3.3 脉冲位置编码 129

5.3.4 脉冲幅度编码 130

5.3.5 联合的脉冲幅度量化(JPAQ) 132

5.4 码激励线性预测编码 134

5.4.1 引言 134

5.4.2 短期预测(STP) 135

5.4.3 长期预测(LTP) 136

5.4.4 辅助激励的计算 145

5.4.5 LTP和辅助激励联合计算 159

5.4.6 具有后滤波的CELP 160

参考文献 162

第6章 低时延语音编码 165

6.1 编码时延与对低时延编码器的要求 165

6.2 G.728 16kbit/s LD-CELP语音编码器 166

6.2.1 方框图与工作原理 166

6.2.2 高阶后向自适应线性预测 168

6.2.3 听觉加权滤波器 169

6.2.4 激励增益预测器 170

6.2.5 码书结构与搜寻 171

6.2.6 同步和带内信令 178

6.2.7 自适应后置滤波器(adaptive post-filter) 178

6.2.8 G.728编解码器的复杂度和性能 182

参考文献 183

第7章 多带激励声码器 184

7.1 导言 184

7.2 多带激励语音模型 185

7.3 多带激励语音分析 189

7.3.1 频域分析 190

7.3.2 时域分析 192

7.3.3 INMARSAT-M IMBE模型分析算法 195

7.4 多带激励语音合成 204

7.4.1 清音成分的合成 204

7.4.2 浊音成分的合成 205

7.4.3 重建语音的产生 207

参考文献 207

8.1 波形内插语音编码 208

第8章 低速率语音编码 208

8.1.1 浊音语音的波形内插 209

8.1.2 广义WI模型 212

8.1.3 2.4kbit/s GWI语音编码系统 215

8.2 正弦变换编码 218

8.2.1 语音信号的正弦分析 218

8.2.2 语音信号的正弦合成 219

8.2.3 低比特率正弦编码器 220

8.2.4 与原型波形内插相结合 221

8.2.5 基音的频域估计法 222

8.2.6 确定残差信号的正弦模型参数 223

8.2.7 正弦激励参数的量化 227

8.2.8 正弦变换解码器 231

8.2.9 正弦变换编码器的性能 232

参考文献 234

第9章 宽带语音编码 235

9.1 引言 235

9.2 子带编码(sub-band coding) 236

9.2.1 工作原理 236

9.2.2 子带编码的比特分配 237

9.3 G.722宽带语音编码 240

9.3.1 技术要求 240

9.3.2 方框图 240

9.3.3 SB-ADPCM编码器的工作原理 241

9.3.4 SB-ADPCM解码器的工作原理 242

9.3.5 正交镜像滤波器组(quadrature-mirror filter bank) 244

9.3.6 G.722自适应量化与预测 251

参考文献 256

10.1 语音编码标准的发展概况 257

第10章 语音编码的方案和标准算法 257

10.2 语音编码器的属性 258

10.2.1 比特率 258

10.2.2 延迟 258

10.2.3 复杂度 259

10.2.4 语音质量 259

10.2.5 规范和适应性的确认 260

10.3 世界上有哪些标准化实体,他们是怎样开展工作的 261

10.3.1 国际电信联盟(ITU) 261

10.3.2 北美的标准化组织 262

10.3.3 欧洲电信标准研究所 262

10.3.4 日本的RCR 262

10.3.5 我国的电信标准化组织 262

10.3.7 语音编码器的性能测量 263

10.3.6 建立参考条款 263

10.3.8 工作日程 264

10.4 现在的语音编码标准 264

10.4.1 ITU公布的具有电话带宽的语音编码器 265

10.4.2 ITU-T近期发布的电话带宽语音编码器 266

10.4.3 ITU 7kHz宽带语音编码器 267

10.4.4 欧洲的数字蜂窝电话语音编码器 268

10.4.5 北美的数字蜂窝语音编码器 269

10.4.6 日本的数字蜂窝电话编码器 270

10.4.7 国际海事卫星4.15kbit/sIMBE编码器 271

10.4.8 用于保密通信的语音编码标准 272

10.5 语音编码器性能的总结 273

10.6 附加的信息 274

参考文献 274

11.1.2 对信号功率级的依赖 277

11.1.1 对发音者和语言的依赖 277

11.1 语音质量的定义 277

第11章 语音编码器的质量评价 277

11.1.3 背景噪声 278

11.1.4 多种编码的级联 278

11.1.5 信道误差所产生的影响 279

11.1.6 非语音信号 279

11.2 语音质量的客观测量 279

11.3 语音质量的主观测量 280

11.3.1 绝对等级的评定试验(ACR) 281

11.3.2 降低等级的评定试验(DCR) 281

11.3.3 诊断测量试验(DAM) 282

11.3.4 通话试验 282

11.3.5 主观质量的预测 282

11.4.2 对谈话者的辨认能力 283

11.4.1 可懂度 283

11.4 测量语音可懂度和对发音人的识别能力 283

11.5 汉语清晰度测量和语音质量的诊断 284

11.6 检测语音质量的数据库和另外的试验信号 287

11.7 典型MOS试验的描述 288

11.7.1 试验方法和实验的设计 288

11.7.2 语音材料的选择和处理 288

11.7.3 试验结果 290

11.8 确认语音编码器实现的方法 291

11.9 复杂度和延迟的测量 292

11.9.1 复杂度 292

11.9.2 延迟 293

11.10 结论 293

参考文献 293

12.2 数字信号处理器(DSP) 298

12.1 引言 298

第12章 语音编码的实时实现 298

12.2.1 DSP芯片的发展概况 299

12.2.2 定点实现的DSP 300

12.2.3 浮点实现的DSP 304

12.2.4 TI公司的TMS320 C6000芯片系列 305

12.3 实时的软件开发方法 308

12.4 典型的CELP实现方案 309

12.4.1 AT T的WE-DSP32 309

12.4.2 典型的WE-DSP32C基础硬件 310

12.5 DSP的开发和调试工具 312

12.6 有效的编程技术 313

12.6.1 CELP复杂性降低的策略 314

12.6.2 典型CELP方案中对处理和存储的要求 317

参考文献 318

第13章 系统应用中的有关问题 319

13.1 引言 319

13.2 回波抵消 320

13.2.1 数字回波抵消器的原理 321

13.2.2 回波抵消的数学表述 322

13.3 语音不连续的传输(DTX) 324

13.3.1 声音激活的检测 325

13.3.2 语音加数据的编码和传输 328

13.4 传输过程中的同步 329

13.5 语音数据的安全 331

参考文献 333

课程习题与设计选题汇集 334

附录 G.729 8kbit/s共轭结构一代数码激励线性预测编码 337

本书缩写字的中英文译名 370

相关图书
作者其它书籍
返回顶部