第1章 绪论 1
1.1 语音信号处理的发展 1
1.1.1 语音合成 1
1.1.2 语音编码 2
1.1.3 语音识别 4
1.2 语音信号处理的应用 6
1.3 语音信号处理的过程 8
1.4 MATLAB在数字语音信号处理中的应用 9
习题1 9
第2章 语音信号的数字模型 10
2.1 语音的发声机理 10
2.1.1 人的发声器官 10
2.1.2 语音生成 11
2.2 语音的听觉机理 11
2.2.1 听觉器官 12
2.2.2 听觉掩蔽效应 12
2.2.3 临界带宽与频率群 13
2.2.4 耳蜗的信号处理机制 14
2.2.5 语音信号听觉模型 15
2.3 语音信号的线性模型 15
2.3.1 激励模型 16
2.3.2 声道模型 17
2.3.3 辐射模型 19
2.3.4 语音信号数字模型 19
2.4 语音信号的非线性模型 20
2.4.1 线性模型局限性 21
2.4.2 几种非线性模型 21
2.4.3 非线性动力学模型 22
2.4.4 非线性模型在语音信号处理中的应用及MATLAB实现 23
习题2 26
第3章 语音信号的短时时域分析 27
3.1 语音信号的预处理 27
3.1.1 语音信号的预加重处理 27
3.1.2 语音信号的加窗处理 29
3.2 短时平均能量 32
3.3 短时平均幅度函数 34
3.4 短时平均过零率 36
3.5 短时自相关分析 38
3.5.1 短时自相关函数 38
3.5.2 语音信号的短时自相关函数 39
3.5.3 修正的短时自相关函数 44
3.5.4 短时平均幅度差函数 46
3.6 基于能量和过零率的语音端点检测 47
3.7 基音周期估值 48
3.7.1 基于短时自相关法的基音周期估值 48
3.7.2 基于短时平均幅度差函数AMDF法的基音周期估值 52
3.7.3 基音周期估值的后处理 54
3.7.4 基音周期估值后处理的MATLAB实现 55
习题3 58
第4章 语音信号短时频域及倒谱分析 60
4.1 傅里叶变换的解释 60
4.1.1 短时傅里叶变换 60
4.1.2 窗函数的作用 61
4.2 滤波器的解释 66
4.2.1 短时傅里叶变换的滤波器实现形式一 66
4.2.2 短时傅里叶变换的滤波器实现形式二 66
4.3 短时综合的滤波器组相加法 67
4.3.1 短时综合的滤波器组相加法原理 67
4.3.2 短时综合的滤波器组相加法的MATLAB程序实现 69
4.3.3 短时综合的叠接相加法原理及MATLAB程序实现 74
4.4 语音信号的复倒谱和倒谱分析及应用 78
4.4.1 复倒谱和倒谱的定义及性质 78
4.4.2 复倒谱的几种计算方法 80
4.4.3 倒谱的MATLAB实现 83
4.4.4 语音的倒谱分析及应用 84
习题4 91
第5章 语音信号线性预测分析 92
5.1 LPC的基本原理 92
5.1.1 LPC的实现方法 92
5.1.2 语音信号模型和LPC之间的关系 93
5.1.3 模型增益G的确定 95
5.2 线性预测分析的解法 96
5.2.1 自相关法 96
5.2.2 协方差法 97
5.2.3 自相关法的MATLAB实现 97
5.3 线谱对LSP分析 99
5.3.1 LSP的定义和特点 99
5.3.2 LPC参数到LSP参数的转换及MATLAB实现 103
5.3.3 LSP参数到LPC参数的转换及MATLAB实现 105
5.4 LPC的几种推演参数 107
5.4.1 反射系数 107
5.4.2 对数面积比系数LAR 107
5.4.3 预测器多项式的根 107
5.4.4 预测误差滤波器的冲激响应及其自相关系数 108
5.4.5 LPC倒谱及其MATLAB实现 108
习题5 110
第6章 矢量量化 113
6.1 矢量量化基本原理 114
6.1.1 矢量量化的定义 114
6.1.2 失真测度 115
6.1.3 矢量量化器 116
6.2 最佳矢量量化器 116
6.3 矢量量化器的设计算法及MATLAB实现 117
6.3.1 LBG算法 117
6.3.2 初始码书的选定与空胞腔的处理 120
6.3.3 已知训练序列的LBG算法的MATLAB实现 121
6.3.4 树形搜索矢量量化器 123
习题6 125
第7章 语音编码原理及应用 126
7.1 语音编码的分类及特性 126
7.1.1 波形编码 126
7.1.2 参数编码 126
7.1.3 混合编码 127
7.2 语音编码性能的评价指标 127
7.2.1 编码速率 127
7.2.2 编码语音质量评价 128
7.2.3 编解码延时 128
7.2.4 算法复杂度 128
7.3 语音信号波形编码 128
7.3.1 脉冲编码调制PCM 128
7.3.2 自适应预测编码APC 132
7.3.3 G.721编码及算法实现 134
7.4 语音信号参数编码 146
7.4.1 LPC声码器原理 146
7.4.2 LPC-10编码器 146
7.5 语音信号混合编码 150
7.5.1 合成分析技术和感觉加权滤波器 150
7.5.2 激励模型的演变 151
7.5.3 G.728语音编码标准简介 151
7.6 语音信号宽带变速率编码 152
习题7 153
第8章 语音合成 155
8.1 语音合成的原理及分类 155
8.1.1 波形合成法 155
8.1.2 参数合成法 156
8.1.3 规则合成法 156
8.2 共振峰合成法 157
8.2.1 级联型共振峰模型 157
8.2.2 并联型共振峰模型 157
8.2.3 混合型共振峰模型 158
8.3 线性预测参数合成法 159
8.4 基音同步叠加法 161
8.4.1 基音同步叠加PSOLA算法原理 162
8.4.2 基音同步叠加PSOLA算法实现步骤 163
8.5 文语转换系统 164
8.5.1 文语转换系统的组成 164
8.5.2 汉语按规则合成 165
习题8 170
第9章 语音识别基本原理与应用 172
9.1 语音识别系统概述 172
9.1.1 语音信号预处理 172
9.1.2 语音识别特征提取 173
9.1.3 语音训练识别模型 175
9.2 HMM基本原理及在语音识别中的应用 178
9.2.1 隐马尔可夫模型 178
9.2.2 隐马尔可夫模型的3个基本问题 179
9.2.3 隐马尔可夫模型用于语音识别 186
9.3 支持向量机在语音识别中的应用 189
9.3.1 支持向量机分类原理 189
9.3.2 支持向量机的模型参数选择问题 193
9.3.3 支持向量机用于语音识别的MATLAB实现 195
习题9 198
第10章 语音增强原理及应用 199
10.1 语音和噪声的主要特性 199
10.1.1 语音的主要特性 199
10.1.2 噪声的特性 199
10.2 语音增强算法的分类 200
10.3 单通道语音增强算法及MATLAB仿真实现 201
10.3.1 谱减法 201
10.3.2 维纳滤波法 204
10.3.3 最小均方误差估计法 206
10.3.4 子空间语音增强算法 209
10.4 多通道语音增强算法及MATLAB仿真实现 214
10.4.1 阵列信号系统模型 214
10.4.2 麦克风阵列近场模型与远场模型 215
10.4.3 经典麦克风阵列的语音增强算法 215
习题10 218
第11章 小波分析及在语音信号处理中的应用 220
11.1 基础理论 220
11.2 小波的特性 220
11.2.1 连续小波变换及性质 221
11.2.2 离散小波变换及性质 222
11.3 几种常用的小波及特性 222
11.3.1 Haar小波 223
11.3.2 Daubechies(dbN)小波 224
11.3.3 Mexican Hat(Marr)小波 225
11.3.4 Morlet小波 226
11.3.5 Meyer小波 227
11.4 小波变换在语音信号处理中的应用 230
11.4.1 小波分析在语音信号预处理的应用及MATLAB实现 230
11.4.2 小波分析在语音去噪中的应用及MATLAB实现 233
习题11 235
第12章 人工神经网络及在语音信号处理中的应用 236
12.1 人工神经网络简介 236
12.2 人工神经网络构成 237
12.2.1 神经元 237
12.2.2 网络拓扑 238
12.2.3 网络的学习算法 239
12.3 几种神经网络模型及其算法 240
12.3.1 单层感知器 240
12.3.2 多层感知器 241
12.3.3 径向基函数神经网络 243
12.3.4 自组织特征映射神经网络 246
12.4 神经网络在语音信号处理中的应用 248
12.4.1 RBF神经网络在语音识别中的应用及MATLAB实现 248
12.4.2 自组织神经网络在语音编码中的应用及MATLAB实现 253
习题12 257
第13章 独立分量分析及在语音信号处理中的应用 259
13.1 基础理论 259
13.1.1 ICA的定义与数学模型 259
13.1.2 ICA的基本假设、不确定性及求解过程 260
13.1.3 ICA中信号的预处理 261
13.1.4 ICA的目标函数 263
13.1.5 ICA性能评价参数 267
13.2 经典ICA算法 267
13.2.1 自然梯度算法 268
13.2.2 信息最大化法 269
13.2.3 快速ICA算法(FASTICA) 269
13.3 ICA在语音信号处理中的应用及MATLAB实现 271
13.3.1 INFORMAX算法在语音盲信号分离中的应用及MATLAB实现 271
13.3.2 FASTICA算法在语音盲信号分离中的应用及MATLAB实现 274
习题13 276
第14章 语音质量评价和可懂度评价 278
14.1 语音质量与可懂度 278
14.2 语音质量的主观评价方法 278
14.3 语音可懂度的主观评价方法 280
14.4 语音质量客观评价方法 282
14.4.1 时域和频域分段信噪比的方法及MATLAB实现 282
14.4.2 基于LPC客观评价方法及MATLAB实现 286
14.4.3 语音质量的感知评价方法(PESQ)及MATLAB实现 288
14.5 语音可懂度客观评价方法 293
14.5.1 加权频带信噪比评价方法及MATLAB实现 293
14.5.2 归一化协方差评价方法(NCM)及MATLAB实现 296
14.5.3 短时清晰度指数评价方法(AI-ST)及MATLAB实现 299
习题14 302
附录A 专业术语缩写英汉对照表 303
附录B 程序索引 307
参考文献 309