《语音信号处理实用教程》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:吴进编著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2015
  • ISBN:9787115380876
  • 页数:338 页
图书介绍:本书内容包括绪论、语音信号处理基础知识、语音信号时域分析、语音信号频域分析、语音信号的同态处理和倒谱分析、矢量量化技术、神经网络在语音信号处理中的应用、语音识别、说话人识别、语音增强等内容,以及语音信号的线性预测分析、矢量量化技术、隐马尔可夫模型、语音编码、语音合成、语音信号处理实验等内容,同时学会用MATLAB语言来处理实际的语音信号。

第1篇 语音信号处理基础篇 2

第1章 绪论 2

1.1语音信号处理概述 2

1.2语音信号处理的发展 3

1.3语音信号处理的应用 5

1.4本书内容 7

思考与练习 7

第2章 语音信号处理的基础知识 8

2.1语音和语言 8

2.2语音产生的过程及其声学特性 9

2.2.1语音的发音器官 9

2.2.2人类语音的产生过程 10

2.2.3共振峰频率 11

2.3语音信号的声学特性 12

2.3.1语音信号的物理属性 12

2.3.2语音信号的统计特性 13

2.3.3语音信号的时间波形和频谱特性 14

2.4语音信号产生的数字模型 15

2.4.1激励模型 16

2.4.2声道模型 17

2.4.3辐射模型 21

2.4.4完整的语音信号数字模型 21

2.5人类的听觉功能 22

2.5.1听觉器官 22

2.5.2听觉感知 23

2.5.3声音三要素 24

2.5.4听觉掩蔽效应 26

思考与练习 28

第2篇 语音信号处理分析篇 31

第3章 语音信号的时域分析 31

3.1语音信号的数字化和预处理 31

3.1.1采样和量化 32

3.1.2预处理 34

3.1.3语音信号的加窗处理 36

3.2短时能量分析 38

3.2.1短时平均能量 38

3.2.2短时平均幅度 41

3.3短时过零分析 42

3.4短时相关分析 45

3.4.1短时自相关函数 46

3.4.2修正的短时自相关函数 49

3.4.3短时平均幅度差函数 50

3.5基音周期估值 51

3.5.1基于短时自相关法的基音周期估值 51

3.5.2基于短时平均幅度差函数AMDF法的基音周期估值 54

3.5.3基音周期估值的后处理 54

思考与练习 57

第4章 语音信号的频域分析 58

4.1短时傅里叶变换的定义 58

4.2短时傅里叶变换的两种解释 59

4.2.1标准傅里叶变换的解释 59

4.2.2滤波器的解释 61

4.3短时傅里叶变换的采样率 63

4.3.1时域采样率 63

4.3.2频域采样率 63

4.3.3总采样率 64

4.4语音信号的短时综合 65

4.4.1滤波器组求和法 65

4.4.2快速傅里叶变换求和法 68

4.5语谱图 70

思考与练习 71

第5章 语音信号的同态处理 72

5.1卷积同态处理的基本原理 72

5.2复倒谱和倒谱 74

5.2.1复倒谱 74

5.2.2倒谱 75

5.3语音信号的复倒谱 76

5.3.1声门激励信号的复倒谱 76

5.3.2声道冲激响应序列的复倒谱 77

5.4复倒谱的几种计算方法 78

5.4.1微分法 79

5.4.2最小相位信号法 80

5.4.3递推法 82

5.5语音的倒谱分析及应用 83

5.5.1语音同态滤波系统构成 83

5.5.2语音的倒谱分析原理 84

5.5.3语音的倒谱应用 86

思考与练习 89

第6章 语音信号的线性预测分析 90

6.1线性预测分析的基本原理 90

6.1.1信号模型 91

6.1.2语音信号的线性预测模型 92

6.2线性预测方程的建立 93

6.3线性预测分析的经典解法 95

6.3.1自相关法 95

6.3.2协方差法 97

6.3.3自相关法和协方差法的比较 99

6.4格型法 99

6.4.1格型法的基本原理 100

6.4.2格型法的求解 101

6.5线谱对LSP分析 104

6.5.1 LSP的定义和特点 104

6.5.2 LPC参数到LSP参数的转换 107

6.5.3 LSP参数到LPC参数的转换 108

6.6导抗谱对ISP分析 109

6.6.1 ISP的定义和特点 109

6.6.2 LPC与ISP参数间的转换 112

6.7 LPC导出的其他语音参数 112

6.7.1反射系数 112

6.7.2对数面积比系数LAR 112

6.7.3 LPC倒谱系数LPCC 113

6.8 LPC分析的频域解释 114

6.8.1最小预测误差的频域解释 114

6.8.2 LPC谱估计 115

思考与练习 117

第7章 语音信号的矢量量化 120

7.1矢量量化的基本原理 120

7.1.1矢量量化的定义 121

7.1.2矢量量化系统的工作过程 122

7.1.3矢量量化与标量量化的比较 123

7.1.4失真测度 123

7.2最佳矢量量化器 126

7.2.1最佳划分 126

7.2.2最佳码书 126

7.3矢量量化器的设计算法 127

7.3.1 LBG算法 127

7.3.2初始码书的生成 129

7.3.3空胞腔的处理 130

7.4降低复杂度的矢量量化系统 131

7.4.1树形搜索矢量量化器 131

7.4.2多级矢量量化器 134

7.4.3波形/增益矢量量化器 135

7.4.4分离均值矢量量化器 136

7.4.5有记忆的矢量量化器 136

7.5语音参数的矢量量化 138

思考与练习 139

第8章 隐马尔可夫模型 141

8.1隐马尔可夫模型的引入 141

8.2隐马尔可夫模型的定义 144

8.3隐马尔可夫模型的计算 146

8.3.1概率Pr[Y/λ]的计算 146

8.3.2 HMM的识别 147

8.3.3 HMM的训练 147

8.4 HMM的各种结构类型 148

8.4.1 A矩阵参数分类 148

8.4.2 B矩阵参数分类 149

8.4.3其他一些特殊的HMM形式 149

8.5 HMM的一些实际问题 150

8.5.1下溢问题 150

8.5.2参数的初始化问题 150

8.5.3 B矩阵参数的选择 150

思考与练习 151

第9章 语音信号检测分析 152

9.1基音提取 152

9.1.1自相关法 154

9.1.2并行处理法 157

9.1.3倒谱法 158

9.1.4简化逆滤波法 159

9.2共振峰估值 161

9.2.1带通滤波器组法 162

9.2.2离散傅里叶变换(DFT) 163

9.2.3倒谱法 164

9.2.4 LPC法 165

思考与练习 166

第3篇 语音信号处理应用篇 168

第10章 语音编码 168

10.1语音信号的压缩编码原理 168

10.1.1语音压缩的基本原理 169

10.1.2语音通信中的语音质量 169

10.1.3语音编码的分类 170

10.2语音编码性能的评价指标 171

10.2.1编码速率 171

10.2.2编码质量 171

10.2.3编解码延时 173

10.2.4算法复杂度 173

10.3语音信号波形编码 173

10.3.1脉冲编码调制PCM 174

10.3.2自适应预测编码APC 185

10.3.3自适应差分脉冲编码调制ADPCM 188

10.3.4子带编码SBC 193

10.3.5变换编码TC 195

10.4语音信号参数编码 203

10.4.1声码器的工作原理 204

10.4.2相位声码器 205

10.4.3通道声码器 207

10.4.4共振峰声码器 209

10.4.5同态声码器 209

10.4.6线性预测声码器 211

10.5语音信号混合编码 217

10.5.1合成分析技术 218

10.5.2感觉加权滤波器 218

10.5.3激励模型的改进 219

10.5.4 G.728语音编码标准简介 223

10.6语音信号宽带变速率编码 224

10.7各种语音编码方法的比较 225

10.7.1波形编码的信号压缩技术 225

10.7.2波形编码和声码器的比较 226

10.7.3各种声码器的比较 226

思考与练习 227

第11章 语音合成 229

11.1概述 229

11.2语音合成原理 230

11.2.1波形合成法 230

11.2.2参数合成法 231

11.2.3规则合成法 232

11.3语音合成系统的特性 233

11.3.1合成单元 233

11.3.2合成参数 234

11.3.3合成音质 234

11.4共振峰合成 235

11.4.1共振峰合成原理 235

11.4.2级联型共振峰模型 237

11.4.3并联型共振峰模型 238

11.4.4共振峰合成实例 238

11.5线性预测合成 239

11.6基音同步叠加法 242

11.6.1算法原理 242

11.6.2算法实现步骤 244

11.7文语转换系统 245

11.7.1文语转换系统的组成 245

11.7.2汉语按规则合成 246

11.8语音合成技术的应用 246

11.8.1语音合成的典型应用 246

11.8.2专用语音合成硬件及语音合成器芯片 248

思考与练习 250

第12章 语音识别 251

12.1概述 251

12.2语音识别原理 254

12.3动态时间规整 263

12.4有限状态矢量量化技术 265

12.4.1 FSVO原理及FSVQ声码器 265

12.4.2 FSVQ语音识别器 266

12.5孤立词识别系统 267

12.6连续语音识别 271

12.6.1识别基元的选择与切分 271

12.6.2发音变化及音征提取 272

12.6.3训练及新的识别方法 272

12.6.4基于HMM统一框架的大词汇量非特定人连续语音识别 272

思考与练习 274

第13章 说话人识别 276

13.1概述 276

13.2特征选取 277

13.2.1说话人识别所用特征 278

13.2.2特征类型的优选准则 279

13.3说话人识别系统的结构 280

13.4说话人识别中的识别方法 281

13.4.1模板匹配法 281

13.4.2概率统计方法 282

13.4.3动态时间规整方法 282

13.4.4矢量量化方法 283

13.4.5隐马尔可夫模型方法 284

13.4.6人工神经网络方法 284

13.5声纹识别应用前景 285

13.5.1声纹识别特性 285

13.5.2声纹识别应用 285

13.5.3声纹识别未来 285

思考与练习 285

第14章 语音增强 286

14.1概述 286

14.2语音特性、人耳感知特性及噪声特性 287

14.2.1语音特性 287

14.2.2人耳感知特性 288

14.2.3噪声特性 288

14.3语音增强算法 290

14.3.1参数方法 290

14.3.2非参数方法 290

14.3.3统计方法 290

14.3.4其他方法 291

14.4滤波器法 292

14.4.1固定滤波器 292

14.4.2自适应滤波 292

14.4.3变换技术 293

14.5非线性处理语音增强 293

14.5.1中心削波 294

14.5.2同态滤波法 294

14.6谱减法 294

14.6.1谱减法的原理 294

14.6.2谱减法的改进形式 295

14.6.3谱减法语音增强的仿真实现 297

14.7自相关相减法 298

14.8自适应噪声对消 299

14.8.1自适应滤波 299

14.8.2具有参考信号的自适应噪声对消 299

14.8.3利用延迟来建立参考信号的自适应噪声对消 301

思考与练习 302

第15章 语音处理的实时实现 303

15.1可编程DSP芯片应用基础 303

15.1.1 DSP的发展历程 303

15.1.2 DSP芯片的特点 304

15.1.3 DSP芯片的分类 304

15.1.4 DSP芯片的基本结构 305

15.1.5常用DSP芯片简介 306

15.1.6 DSP芯片的应用 308

15.2基于DSP的语音处理系统 308

15.2.1基于DSP的实时语音处理系统的构成 308

15.2.2基于DSP的实时语音处理系统的特点 309

15.2.3基于DSP的实时语音处理系统的设计过程 309

15.3 DSP CCS集成开发环境 310

15.3.1 DSP的开发工具 310

15.3.2 CCS概述 310

15.3.3 CCS的构成 312

15.4基于TMS320C5409的实时语音识别系统 315

15.4.1硬件介绍 315

15.4.2软件设计 321

15.4.3独立系统形成 323

思考与练习 323

附录 汉英名词术语对照 324

参考文献 337