《数字语音处理》PDF下载

  • 购买积分:13 如何计算积分?
  • 作  者:姚天任主编
  • 出 版 社:武汉:华中科技大学出版社
  • 出版年份:1992
  • ISBN:9787560906188
  • 页数:399 页
图书介绍:本书系统全面地讨论了语音信号数字处理的理论基础、各种方法和某些重要应用领域。本书主要为研究生和本科高年级学生写的。但也可作为工程技术人员和科学研究工作者的一本有用参考书。

第一章 绪论 1

1.1 数字语音处理研究的内容 1

1.2 语音处理的发展历史 3

1.3 本书的内容 4

第二章 语音信号产生的数字模型 6

2.1 人类的语言器官 6

2.2 语音产生过程 8

2.3 语音信号产生的数字模型 11

2.4 语音信号的特性 14

2.4.1 语音的声学特性 14

2.4.2 语音的时间波形和频谱特性 15

2.4.3 语音信号的统计特性 20

2.5 人类的听觉功能 24

第三章 语音波形的数字编码 27

3.1 脉冲编码调制(PCM) 28

3.1.1 语音信号的取样 29

3.1.2 取样语音信号的量化 31

3.1.3 减小量化噪声影响的方法 37

3.2 差分脉冲编码调制(DPCM) 41

3.2.1 DPCM原理 41

3.2.2 DPCM的信噪比 44

3.2.3 预测系数对差分增益的影响 47

3.3 增量调制(DM) 50

3.3.1 DM原理 50

3.3.2 DM的斜率过载失真和颗粒噪声 52

3.3.3 DM的信噪比 53

3.4 自适应技术在语音波形编码中的应用 55

3.4.1 一般原理 55

3.4.2 自适应量化 56

3.4.3 自适应增量调制(ADM) 67

3.4.4 自适应线性预测 72

3.5 压缩比特率的其它方法 81

3.5.1 残差信号压缩 81

3.5.2 噪声整形 83

3.5.3 多脉冲技术 85

第四章 短时时域处理技术 87

4.1 语音信号的短时处理方法 88

4.2 短时能量和短时平均幅度 89

4.2.1 短时能量 89

4.2.2 短时平均幅度 93

4.3 短时平均过零率 97

4.4 短时自相关函数 100

4.4.1 短时自相关函数的定义 100

4.4.2 减少短时自相关函数计算量的方法 101

4.4.3 语音信号的短时自相关函数的实例 103

4.4.4 短时自相关函数的另一种计算方法 104

4.4.5 短时平均幅度差函数 108

4.5 短时时域处理技术应用举例 109

4.5.1 语音段起止端点判别 109

4.5.2 基音周期的估计 111

4.6 中值滤波在语音短时时域处理中的应用 114

第五章 短时傅里叶分析 120

5.1 短时傅里叶变换的定义 120

5.1.1 定义 120

5.1.2 移动窗形状对短时傅里叶变换的影响 121

5.1.3 窗宽对短时频谱的影响 124

5.1.4 结论 125

5.2 短时傅里叶变换的某些性质 126

5.3 短时傅里叶变换的线性滤波实现 127

5.4 短时傅里叶谱的取样 130

5.4.1 短时傅里叶变换的时域取样 130

5.4.2 短时傅里叶变换的频域取样 131

5.4.3 短时傅里叶变换时域和频域总取样率 131

5.5 语音的短时合成技术 132

5.5.1 语音短时合成的滤波器组相加法 133

5.5.2 短时傅里叶变换的欠速率取样 137

5.5.3 语音短时合成的叠接相加法 139

5.5.4 短时频谱变化对合成结果的影响 143

5.6 短时分析-合成数字滤波器组的设计 148

5.6.1 设计中需要考虑的实际问题 149

5.6.2 IIR滤波器组的设计 157

5.6.3 FIR带通滤波器组的设计 159

5.7 用快速傅里叶变换进行短时傅里叶分析 167

5.7.1 基本原理 167

5.7.2 减少计算量的其它考虑 171

5.7.3 用FFT节省短时谱合成语音信号的计算量 172

第六章 语音信号的线性预测 177

6.1 线性预测基本原理 177

6.2 线性预测和信号模型之间的关系 179

6.3 Levinson-Durbin算法 184

6.4 格型滤波器 191

6.4.1 前向预测和反向预测 191

6.4.2 格型滤波器的结构 194

6.4.3 格型滤波器的性质 196

6.5 由已知数据计算预测系数的方法 199

6.5.1 自相关法或Yule-Walker法 199

6.5.2 协方差法 202

6.5.3 Burg法 203

6.6 线性预测的频域解释 206

6.6.1 最小预测误差 207

6.6.2 线性预测谱匹配性质 208

6.7 线性预测模型的局限性 211

6.7.1 基音频率对预测系数的影响 212

6.7.2 高频损失问题 213

6.8 线性预测分析应用举例 214

6.8.1 基音检测 214

6.8.2 共振峰估计 217

6.9 对数面积比(LAR)参数 219

第七章 语音信号的同态滤波和倒谱分析 220

7.1 广义叠加原理 220

7.2 卷积同态系统 223

7.3 复倒谱的定义 225

7.3.1 复对数的多值性问题 225

7.3.2 ?(z)的解析性问题 226

7.4 复倒谱的性质和计算方法 227

7.4.1 复倒谱的性质 227

7.4.2 复倒谱的计算方法 228

7.5 语音的倒谱分析 231

第八章 矢量量化 236

8.1 矢量量化基本原理 237

8.1.1 矢量量化过程 237

8.1.2 失真的测度 240

8.1.3 码本的设计 244

8.1.4 计算量和存贮量的估计 247

8.1.5 几个例子 248

8.2 矢量量化器的理论性能 256

8.2.1 率-失真理论 256

8.2.2 率-失真理论的一些结果 259

8.2.3 标量量化 265

8.2.4 矢量量化的一些理论结果 269

8.3 矢量源的标量量化和矢量量化 273

8.3.1 比特分配 274

8.3.2 相关源的矢量旋转 277

8.3.3 标量量化和矢量量化的比较 281

8.4 减少矢量量化中计算量和存贮量的方法 285

8.4.1 二叉树搜索 285

8.4.2 多级矢量量化 289

8.4.3 乘积码 293

8.5 码本的训练和测试 296

8.6 码本的鲁棒性 299

8.7 时间依赖矢量量化 302

8.7.1 选帧传送 302

8.7.2 分段量化 302

8.7.3 自适应矢量量化器 303

8.8 语音波形矢量量化 305

8.8.1 波形标量量化 305

8.8.2 波形矢量量化 307

第九章 隐马尔柯夫模型(HMM) 312

9.1 隐马尔柯夫模型的定义 312

9.1.1 信号模型 312

9.1.2 离散马尔柯夫过程 313

9.1.3 隐马尔柯夫模型的概念 316

9.1.4 隐马尔柯夫模型的参数 319

9.2 隐马尔柯夫模型的三个基本问题 320

9.2.1 三个基本问题的提出 320

9.2.2 第1个问题的求解 322

9.2.3 第2个问题的求解 327

9.2.4 第3个问题的求解 329

9.3 隐马尔柯夫模型的类型 332

9.3.1 隐马尔柯夫模型中的连续观测密度 334

9.3.2 自回归隐马尔柯夫模型 336

9.3.3 隐马尔柯夫模型的变型 338

9.3.4 含有状态持续时间密度显函数的隐马尔柯夫模型 339

9.3.5 最佳判据 344

9.3.6 隐马尔柯夫模型的比较 345

9.4 隐马尔柯夫模型的实现问题 347

9.4.1 定标 347

9.4.2 多个观测序列 351

9.4.3 隐马尔柯夫模型参数的初始估计 352

9.4.4 训练数据不够的影响 352

9.4.5 模型选择 354

第十章 数字语音处理的应用 356

10.1 语音压缩 356

10.1.1 声码器的基本结构 357

10.1.2 通道声码器 358

10.1.3 共振峰声码器 361

10.1.4 线性预测编码声码器 362

10.1.5 矢量量化在语音压缩中的应用 363

10.2 语音合成 365

10.2.1 以单词为基础的合成方法 365

10.2.2 以音节为基础的合成方法 366

10.2.3 以音素为基础的合成方法 367

10.2.4 语音合成器芯片和语音合成系统 369

10.3 语音识别 371

10.3.1 孤立单词语音识别 374

10.3.2 线性时间归一化 376

10.3.3 非线性时间归一化 378

10.3.4 采用DTW的孤立单词语音识别 382

10.3.5 隐马尔柯夫模型在孤立单词语音识别中的应用 384

10.3.6 连续语音识别 388

10.4 语音增强 394

参考文献 397