《语音增强 理论与实践》PDF下载

  • 购买积分:16 如何计算积分?
  • 作  者:(美)罗艾洲著;高毅等译
  • 出 版 社:成都:电子科技大学出版社
  • 出版年份:2012
  • ISBN:9787564712938
  • 页数:518 页
图书介绍:本书总共分为十一章,第一章(引言)中对各章节的内容做了概述。全书内容分为三个部分。第一部分介绍了数字信号处理以及语音信号的基础知识,为理解语音增强算法做铺垫。第二部分介绍过去二十年中所提出的各类语音增强算法。第三部分介绍评估语音增强算法性能的方法和手段。书中正文部分专门设计了许多的范例以及图片,以帮助读者理解其中的理论。本书附带的光盘包含了一个语音库,很适合用于评估经算法处理后的语音质量和可懂度。主要的语音增强算法也以MATLAB代码的形式随光盘提供。我一直认为,利用MATLAB开发算法代码,以及利用通用的语音数据库对新的语音增强算法进行评估,对推动该领域的发展是十分关键和必要的。附录C对光盘的内容进行了详细的介绍。本书可以用作语音增强的研究生课程的一学期教材。该课程的先修课程包括数字信号处理以及概率论基础,随机变量与线性代数。本书也可作为语音信号处理课程的补充教材,可选择第四章到第八章,以及第九、十章的部分章节来学习。

第1章 引言 1

1.1 了解敌人:噪声 2

1.2 语音增强算法分类 5

1.3 本书概要 6

参考文献 7

第2章 离散时间信号处理与短时傅立叶分析 9

2.1 离散时间信号 9

2.2 线性时不变系统 10

2.3 z变换 13

2.4 离散时间傅立叶变换(DTFT) 15

2.5 短时傅立叶变换(STFT) 25

2.6 语谱图分析 33

2.7 总结 35

参考文献 35

第3章 语音产生与感知 36

3.1 语音信号 36

3.2 语音产生过程 37

3.3 语音产生的工程模型 43

3.4 语音分类 44

3.5 语音感知的声学特征 45

3.6 总结 52

参考文献 52

第4章 人类对噪声的听觉补偿 54

4.1 多说话人环境下的语音可懂度 54

4.2 影响鲁棒性的语音声学属性 60

4.3 噪声环境中听觉的感知策略 66

4.4 总结 70

参考文献 71

第5章 谱减算法 75

5.1 谱减的基本原理 75

5.2 谱减的几何分析 79

5.3 谱减法的缺点 86

5.4 谱减法中使用过减(over subtraction)技术 87

5.5 非线性谱减 93

5.6 多带谱减法 94

5.7 MMSE谱减算法 98

5.8 扩展谱减法 101

5.9 使用自适应增益平均的谱减 102

5.10 选择性谱减 105

5.11 基于感知特性的谱减 106

5.12 谱减算法的性能 107

5.13 总结 109

参考文献 109

第6章 维纳滤波 113

6.1 维纳滤波原理介绍 113

6.2 时域维纳滤波器 114

6.3 频域维纳滤波器 116

6.4 维纳滤波器与线性预测 117

6.5 维纳滤波器用于噪声抑制 119

6.6 迭代维纳滤波 130

6.7 对迭代维纳滤波施加约束 138

6.8 约束迭代维纳滤波 143

6.9 约束维纳滤波 145

6.10 估计维纳增益函数 151

6.11 维纳滤波中加入心理声学约束 155

6.12 码本驱动维纳滤波 161

6.13 可听(Audible)噪声抑制算法 164

6.14 总结 169

参考文献 170

第7章 基于统计模型的方法 173

7.1 最大似然估计器 173

7.2 贝叶斯估计器 178

7.3 MMSE估计器 178

7.4 改进的判决引导法 189

7.5 MMSE估计的实现和评估 194

7.6 消除音乐噪声 195

7.7 对数MMSE估计器 197

7.8 频谱p次方MMSE估计器 200

7.9 基于非高斯分布的MMSE估计器 203

7.10 最大后验(MAP)估计器 207

7.11 通用贝叶斯估计器 210

7.12 基于听觉感知的贝叶斯估计器 212

7.13 利用语音不存在概率 223

7.14 语音不存在的先验概率估计方法 233

7.15 总结 238

参考文献 238

第8章 子空间算法 242

8.1 导言 242

8.2 利用SVD进行噪声抑制:原理 250

8.3 基于SVD的算法:白噪声 254

8.4 基于SVD的算法:色噪声 263

8.5 基于SVD的方法:统一的视角 266

8.6 基于EVD的方法:白噪声 267

8.7 基于EVD的方法:色噪声 289

8.8 基于EVD的方法:统一的视角 308

8.9 基于感知的(Perceptually-motivated)子空间算法 309

8.10 子空间跟踪算法 316

8.11 总结 331

参考文献 331

第9章 噪声估计算法 337

9.1 话音活动检测与噪声估计 337

9.2 噪声估计算法 338

9.3 最小值跟踪算法 340

9.4 噪声估计的时间递归平均算法 355

9.5 基于直方图的(Histogram-based)技术 378

9.6 其他噪声估计算法 385

9.7 噪声估计算法的客观比较 387

9.8 总结 390

参考文献 391

第10章 语音增强算法的性能评估 395

10.1 音质与可懂度 395

10.2 评估增强语音的可懂度 396

10.3 评估处理后的语音质量 412

10.4 音质判断的信度评估:推荐的测度 422

10.5 客观音质测度 425

10.6 无参考源(Non-intrusive)客观质量测度 447

10.7 音质客观测度的性能指数 447

10.8 客观质量评估面临的挑战以及未来方向 449

10.9 总结 452

参考文献 453

第11章 语音增强算法比较 460

11.1 NOIZEUS:用于音质评估的带噪语音库 460

11.2 增强算法比较:语音质量 461

11.3 增强算法的比较:语音可懂度 475

11.4 音质评估的客观测度的比较 480

11.5 总结 490

参考文献 490

附录A 特殊函数与积分 493

A.1 贝塞尔(Bessel functions) 493

A.2 合流超几何函数(Confluent hyper geometric functions) 495

A.3 积分 495

参考文献 496

附录B MMSE估计器的推导 497

附录C 语音数据库以及MATLAB代码 500

C.1 语音数据库 501

C.2 MATLAB代码 503

参考文献 507

附录D 术语表 509

第一章 509

第二章 509

第三章 510

第四章 511

第五章 512

第六章 513

第七章 514

第八章 514

第九章 515

第十章 516

第十一章 518