第1章 引言 1
1.1 了解敌人:噪声 2
1.2 语音增强算法分类 5
1.3 本书概要 6
参考文献 7
第2章 离散时间信号处理与短时傅立叶分析 9
2.1 离散时间信号 9
2.2 线性时不变系统 10
2.3 z变换 13
2.4 离散时间傅立叶变换(DTFT) 15
2.5 短时傅立叶变换(STFT) 25
2.6 语谱图分析 33
2.7 总结 35
参考文献 35
第3章 语音产生与感知 36
3.1 语音信号 36
3.2 语音产生过程 37
3.3 语音产生的工程模型 43
3.4 语音分类 44
3.5 语音感知的声学特征 45
3.6 总结 52
参考文献 52
第4章 人类对噪声的听觉补偿 54
4.1 多说话人环境下的语音可懂度 54
4.2 影响鲁棒性的语音声学属性 60
4.3 噪声环境中听觉的感知策略 66
4.4 总结 70
参考文献 71
第5章 谱减算法 75
5.1 谱减的基本原理 75
5.2 谱减的几何分析 79
5.3 谱减法的缺点 86
5.4 谱减法中使用过减(over subtraction)技术 87
5.5 非线性谱减 93
5.6 多带谱减法 94
5.7 MMSE谱减算法 98
5.8 扩展谱减法 101
5.9 使用自适应增益平均的谱减 102
5.10 选择性谱减 105
5.11 基于感知特性的谱减 106
5.12 谱减算法的性能 107
5.13 总结 109
参考文献 109
第6章 维纳滤波 113
6.1 维纳滤波原理介绍 113
6.2 时域维纳滤波器 114
6.3 频域维纳滤波器 116
6.4 维纳滤波器与线性预测 117
6.5 维纳滤波器用于噪声抑制 119
6.6 迭代维纳滤波 130
6.7 对迭代维纳滤波施加约束 138
6.8 约束迭代维纳滤波 143
6.9 约束维纳滤波 145
6.10 估计维纳增益函数 151
6.11 维纳滤波中加入心理声学约束 155
6.12 码本驱动维纳滤波 161
6.13 可听(Audible)噪声抑制算法 164
6.14 总结 169
参考文献 170
第7章 基于统计模型的方法 173
7.1 最大似然估计器 173
7.2 贝叶斯估计器 178
7.3 MMSE估计器 178
7.4 改进的判决引导法 189
7.5 MMSE估计的实现和评估 194
7.6 消除音乐噪声 195
7.7 对数MMSE估计器 197
7.8 频谱p次方MMSE估计器 200
7.9 基于非高斯分布的MMSE估计器 203
7.10 最大后验(MAP)估计器 207
7.11 通用贝叶斯估计器 210
7.12 基于听觉感知的贝叶斯估计器 212
7.13 利用语音不存在概率 223
7.14 语音不存在的先验概率估计方法 233
7.15 总结 238
参考文献 238
第8章 子空间算法 242
8.1 导言 242
8.2 利用SVD进行噪声抑制:原理 250
8.3 基于SVD的算法:白噪声 254
8.4 基于SVD的算法:色噪声 263
8.5 基于SVD的方法:统一的视角 266
8.6 基于EVD的方法:白噪声 267
8.7 基于EVD的方法:色噪声 289
8.8 基于EVD的方法:统一的视角 308
8.9 基于感知的(Perceptually-motivated)子空间算法 309
8.10 子空间跟踪算法 316
8.11 总结 331
参考文献 331
第9章 噪声估计算法 337
9.1 话音活动检测与噪声估计 337
9.2 噪声估计算法 338
9.3 最小值跟踪算法 340
9.4 噪声估计的时间递归平均算法 355
9.5 基于直方图的(Histogram-based)技术 378
9.6 其他噪声估计算法 385
9.7 噪声估计算法的客观比较 387
9.8 总结 390
参考文献 391
第10章 语音增强算法的性能评估 395
10.1 音质与可懂度 395
10.2 评估增强语音的可懂度 396
10.3 评估处理后的语音质量 412
10.4 音质判断的信度评估:推荐的测度 422
10.5 客观音质测度 425
10.6 无参考源(Non-intrusive)客观质量测度 447
10.7 音质客观测度的性能指数 447
10.8 客观质量评估面临的挑战以及未来方向 449
10.9 总结 452
参考文献 453
第11章 语音增强算法比较 460
11.1 NOIZEUS:用于音质评估的带噪语音库 460
11.2 增强算法比较:语音质量 461
11.3 增强算法的比较:语音可懂度 475
11.4 音质评估的客观测度的比较 480
11.5 总结 490
参考文献 490
附录A 特殊函数与积分 493
A.1 贝塞尔(Bessel functions) 493
A.2 合流超几何函数(Confluent hyper geometric functions) 495
A.3 积分 495
参考文献 496
附录B MMSE估计器的推导 497
附录C 语音数据库以及MATLAB代码 500
C.1 语音数据库 501
C.2 MATLAB代码 503
参考文献 507
附录D 术语表 509
第一章 509
第二章 509
第三章 510
第四章 511
第五章 512
第六章 513
第七章 514
第八章 514
第九章 515
第十章 516
第十一章 518