当前位置:首页 > 工业技术
语音信号处理
语音信号处理

语音信号处理PDF电子书下载

工业技术

  • 电子书积分:13 积分如何计算积分?
  • 作 者:韩纪庆,张磊,郑铁然编著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2013
  • ISBN:9787302302698
  • 页数:394 页
图书介绍:本书系统地介绍语音信号处理的基础、概念、原理、方法与应用,以及该学科领域取得的新进展。本书系统地介绍语音信号处理的基础、概念、原理、方法与应用,以及该学科领域取得的新进展。本书可作为高等院校计算机应用、信号与信息处理、通信与电子系统等专业及学科的高年级本科生、研究生教材,也可供该领域的科研及工程技术人员参考。
《语音信号处理》目录

第1章 绪论 1

1.1语音信号处理的发展 1

1.2语音信号处理的应用 9

1.3语音信号处理的总体结构 11

参考文献 12

第2章 语音信号的声学基础及产生模型 13

2.1语音信号的产生 13

2.1.1语音的发音器官 14

2.1.2语音的声学特征 16

2.1.3语音信号在时域和频域的表示 18

2.1.4汉语中语音的分类 22

2.1.5汉语语音的韵律特性 24

2.2语音信号的感知 25

2.2.1听觉系统 25

2.2.2听觉特性 27

2.2.3掩蔽效应 28

2.3语音信号的线性产生模型 33

2.3.1激励模型 33

2.3.2声道模型 34

2.3.3辐射模型 35

2.4语音信号的非线性产生模型 35

2.4.1调频-调幅模型的基本原理 36

2.4.2 Teager能量算子 37

2.4.3能量分离算法 37

2.4.4调频-调幅模型的应用 39

参考文献 41

第3章 语音信号的特征分析 43

3.1语音信号数字化 44

3.1.1语音信号的采样和量化 44

3.1.2短时加窗处理 47

3.2语音信号的时域分析 49

3.2.1短时能量分析 49

3.2.2短时平均过零率 50

3.2.3短时自相关函数和短时平均幅度差函数 52

3.2.4端点检测和语音分割 55

3.3语音信号的频域分析 57

3.3.1滤波器组方法 57

3.3.2傅里叶频谱分析 57

3.4传统傅里叶变换缺点及时频分析的思想 61

3.4.1信号的时频表示 62

3.4.2不确定原理 64

3.5 Gabor变换 66

3.6小波变换在语音信号分析中的应用 68

3.6.1小波的数学表示及意义 68

3.6.2小波分析特点 70

3.6.3小波变换的多分辨分析 72

3.6.4小波变换在语音处理中应用 74

3.7语音信号的同态解卷积 76

3.7.1同态信号处理的基本原理 77

3.7.2语音信号的复倒谱 78

3.7.3避免相位卷绕的算法 81

3.7.4基于听觉特性的Mel频率倒谱系数 85

3.8语音信号特征应用 86

3.8.1基音周期估计 86

3.8.2共振峰的估计 92

参考文献 95

第4章 语音信号的线性预测分析 97

4.1线性预测的基本原理 97

4.2线性预测方程组的解法 99

4.2.1自相关法 100

4.2.2协方差法 102

4.2.3格型法 103

4.2.4几种求解线性预测方法的比较 107

4.3线性预测的几种推演参数 108

4.3.1归一化自相关函数 108

4.3.2反射系数 108

4.3.3预测器多项式的根 109

4.3.4 LPC倒谱 110

4.3.5全极点系统的冲激响应及其自相关函数 110

4.3.6预测误差滤波器的冲激响应及其自相关函数 111

4.3.7对数面积比系数 111

4.4线谱对分析法 111

4.4.1线谱对分析的原理 112

4.4.2线谱对参数的求解 113

4.5感知线性预测PLP系数 113

参考文献 114

第5章 语音编码 115

5.1波形编码 116

5.1.1均匀量化PCM 116

5.1.2非均匀量化PCM 116

5.1.3自适应量化PCM 117

5.1.4差分脉冲编码 118

5.1.5自适应差分脉冲编码 120

5.1.6增量调制和自适应增量调制 123

5.1.7子带编码 124

5.1.8自适应变换域编码 126

5.2参数编码和混合编码 127

5.2.1参数编码 127

5.2.2基于全极点语音产生模型的混合编码 133

5.2.3基于正弦模型的混合编码 146

5.3极低速率语音编码技术 151

5.3.1 400bps~1.2Kbps的声码器 151

5.3.2识别合成型声码器 152

5.4语音编码器的性能指标和质量评测方法 153

5.4.1编码速率 154

5.4.2顽健性 154

5.4.3时延 155

5.4.4计算复杂度和算法的可扩展性 155

5.4.5语音质量及其评价方法 156

5.5语音编码国际标准 158

5.6感知音频编码 158

5.6.1感知编码的一般框架 159

5.6.2心理声学模型 160

5.6.3常用的感知编码标准 162

参考文献 164

第6章 语音识别 165

6.1概述 165

6.2基于矢量量化的识别技术 167

6.2.1 K-means矢量量化算法 167

6.2.2 LBG算法 168

6.3动态时间归正的识别技术 169

6.3.1 DTW基本原理 169

6.3.2模板训练算法 171

6.4隐马尔可夫模型技术 173

6.4.1 HMM基本思想 173

6.4.2 HMM基本算法 176

6.4.3 HMM算法实现中的问题 180

6.4.4关于HMM训练的几点考虑 186

6.5连接词语音识别技术 190

6.5.1连接词识别问题的一般描述 191

6.5.2二阶动态规划算法 192

6.5.3分层构筑方法 193

6.6大词表连续语音识别中的声学模型和语言学模型 197

6.6.1声学模型 199

6.6.2统计语言学模型 206

6.6.3统计语言学模型平滑技术 208

6.6.4语言学模型自适应技术 212

6.7大词表连续语音识别中的解码技术 213

6.7.1图的基本搜索算法 214

6.7.2面向语音识别的搜索算法 216

6.8大词表连续语音识别后处理技术 222

6.8.1语音识别中间结果的表示形式 222

6.8.2错误处理 224

6.8.3最小字错误率解码方法 226

6.9基于HMM的自适应技术 231

6.9.1基于Bayesian理论的自适应方法 231

6.9.2基于变换的自适应方法 232

6.10关键词检出技术 234

6.10.1问题描述 235

6.10.2关键词检出系统的组成 237

6.10.3垃圾模型建模方法 237

6.10.4语音解码器的设计 239

6.10.5关键词确认过程 240

6.10.6关键词检出系统性能优化 241

6.11语音识别的应用技术 241

6.11.1语音信息检索 241

6.11.2发音学习技术 243

6.11.3基于语音的情感处理 249

6.11.4网络环境下的语音识别 252

6.11.5嵌入式语音识别技术 255

6.12 HTK工具介绍 256

6.12.1数据准备阶段 259

6.12.2模型训练阶段 263

6.12.3识别阶段 272

参考文献 273

第7章 说话人识别 279

7.1概述 279

7.2说话人识别的特征选取 282

7.2.1特征参数的评价方法 283

7.2.2说话人识别系统中常用的特征 284

7.3说话人识别的主要方法 285

7.3.1与文本有关的识别方法 285

7.3.2与文本无关的识别方法 286

7.3.3文本提示型的识别方法 297

7.4阈值的选取 298

7.5得分规整 299

7.5.1零规整 300

7.5.2测试规整 300

7.5.3说话人自适应的测试规整 301

7.5.4 TZ-norm 302

7.5.5 H-norm 302

7.5.6 C-norm 303

7.6引入区分判别模型的说话人识别 303

7.6.1 SVM 303

7.6.2基于SVM的说话人识别 306

7.6.3基于GMM得分的SVM说话人识别 307

7.6.4基于GMM均值超矢量的SVM说话人识别 308

7.7复杂信道下的说话人识别 309

7.7.1特征映射 310

7.7.2说话人模型合成 311

7.7.3扰动属性投影 312

7.7.4联合因子分析 312

7.8说话人识别中有待解决的问题 313

参考文献 315

第8章 顽健语音识别技术 317

8.1概述 317

8.2影响语音识别性能的环境变化因素 317

8.3噪声环境下的顽健语音识别技术 319

8.3.1基于语音增强的方法 320

8.3.2通道畸变的抑制方法 325

8.3.3基于模型的补偿方法 330

8.4变异语音识别方法 344

8.4.1变异语音的分析 345

8.4.2变异语音的分类 346

8.4.3变异语音的识别 349

参考文献 354

第9章 语音合成 357

9.1语音合成的基本原理 358

9.2参数合成方法 361

9.2.1线性预测合成方法 362

9.2.2共振峰合成方法 363

9.3波形拼接合成技术 369

9.3.1 TD-PSOLA算法 370

9.3.2 FD-PSOLA算法 373

9.4汉语按规则合成 375

9.4.1韵律规则 376

9.4.2多音节协同发音规则合成 382

9.4.3轻声音节规则合成 383

9.4.4儿化音节的规则合成 384

9.5基于HMM的参数化语音合成技术 385

9.5.1基于HMM参数语音合成系统的训练 385

9.5.2基于HMM参数语音合成系统的合成阶段 390

参考文献 393

相关图书
作者其它书籍
返回顶部