当前位置:首页 > 工业技术
语音处理与识别
语音处理与识别

语音处理与识别PDF电子书下载

工业技术

  • 电子书积分:12 积分如何计算积分?
  • 作 者:胡光锐编著
  • 出 版 社:上海:上海科学技术文献出版社
  • 出版年份:1994
  • ISBN:7543905485
  • 页数:331 页
图书介绍:分:语言信号数字处理基础、短时傅里叶分析方法、语言处理与识别的其他方法等8章。
《语音处理与识别》目录

引言 1

第一章 语音信号数字处理基础 4

1.1 发音的生理机构与过程 4

1.2 汉语语音基本特性 7

1.2.1 汉语语音基础 8

1.2.2 元音和辅音 8

1.2.3 声母和韵母 10

1.2.4 音调(字调) 11

1.2.5 音节(字)构成 11

1.2.6 汉语的波形特征 12

1.2.7 元音的频谱特性 13

1.2.8 辅音的频谱特性 13

1.2.9 汉语语音的韵律特性 16

1.3 语音信号的无损声管模型 16

1.3.1 级联无损声管声波传播关系式 16

1.3.2 级联无损声管与数字滤波器的关系 21

1.3.3 无损声管模型的传输函数 25

1.4 语音信号的数字模型 30

习题 35

第二章 语音信号的时域处理方法 39

2.1 短时平均幅度和能量 39

2.2 短时平均过零率 43

2.3 语音的端点检测 45

2.3.1 能量与过零率检测法 45

2.3.2 改进的端点检测方法 47

2.4 短时自关函数 48

2.5 短时平均幅度差函数 55

2.6 基音检测时域方法 56

2.6.1 并联处理方法 56

2.6.2 削波修正自相关基音检测法(AUTOC) 59

2.6.3 平均幅度差函数基音检测法 63

2.7 语音信号的中值滤波 65

习题 68

第三章 语音波形的数字编码 74

3.1 取样和多取样率信号处理 74

3.2 瞬时量化器 79

3.2.1 均匀量化 80

3.2.2 瞬时压扩 84

3.3 自适应量化器 87

3.3.1 前馈自适应量化器 88

3.3.2 反馈自适应量化器 90

3.4 增量调制器 93

3.4.1 线性增量调制器 94

3.4.2 自适应增量调制器 96

3.4.3 增量调制中的高阶预测器 99

3.5 差值脉冲编码调制器 100

3.5.1 具有自适应量化的DPCM 101

3.5.2 带自适应预测的DPCM 102

3.6 数字编码的直接转换 106

3.6.1 LDM-PCM转换 106

3.6.2 PCM-ADPCM转换 107

习题 108

第四章 短时傅里叶分析方法 114

4.1 时变傅里叶变换 114

4.1.1 从第一种定义来解释 115

4.1.2 从第二种定义来解释 117

4.1.3 Xn(ejω)的时域及频域采样率 120

4.2 短时综合的滤波器组相加法 123

4.3 短时综合的重叠相加法 129

4.4 短时频谱变化对综合结果的影响 132

4.4.1 滤波器组相加法(FBS) 132

4.4.2 重叠相加法(OLA) 134

4.4.3 加性改变 135

4.5 滤波器组设计考虑 136

4.6 利用FFT实现滤波器组相加法 144

4.6.1 分析技术 144

4.6.2 综合技术 146

4.7 基音检测 148

4.8 综合分析法 150

4.8.1 基音同步频谱分析 150

4.8.2 共振峰估计 152

4.8.3 声门波的基音同步估值 155

4.9 通道声码器 155

习题 158

第五章 语音信号的同态处理 164

5.1 同态与卷积同态系统 164

5.1.1 广义叠加原理 164

5.1.2 卷积同态系统 168

5.2 复倒谱的性质 173

5.3 特征系统D*的实现 179

5.4 语音的同态处理 182

5.5 基音周期估计 188

5.6 共振峰分析方法 189

5.7 同态声码器 193

习题 195

第六章 语音信号的线性预测编码 200

6.1 线性预测编码的基本原理 201

6.1.1 自相关法 205

6.1.2 协方差法 207

6.1.3 模型增益的计算 209

6.2 解线性预测参数方程组的算法 211

6.2.1 利用乔里斯基分解计算协方差法的方程组 212

6.2.2 利用杜宾递推算法计算自相关法的方程组 216

6.2.3 利用格型法求解线性预测系数 218

6.2.4 各种算法的比较 222

6.3 归一化预测误差 224

6.4 选择线性预测 226

6.5 各种语音参数之间的关系 229

6.5.1 预测器多项式的根 229

6.5.2 LPC系统冲激响应的倒谱 230

6.5.3 全极点系统的冲激响应 230

6.5.4 冲激响应的自关函数 230

6.5.5 预测器多项式的自关函数 231

6.5.6 部分相关系数 231

6.5.7 对数面积比系数 232

6.6 线性预测编码的应用 232

6.6.1 利用LPC参数综合语音 232

6.6.2 利用LPC参数进行基音检测 234

6.6.3 利用LPC参数的共振峰分析 235

6.6.4 LPC声码器 236

习题 238

第七章 语音识别方法与系统 244

7.1 语音识别的基本方法 244

7.2 语音识别系统的分类与组成 248

7.2.1 孤立词语音识别系统 249

7.2.2 连续语音数字识别系统 252

7.2.3 大词汇量单字识别系统 255

7.3 应用于语音识别的有关技术 256

7.3.1 失真测度的选择 256

7.3.2 矢量量化语音识别算法 262

第八章 语音处理与识别的其他方法 265

8.1 含噪语音信号的自适应滤波 265

8.1.1 自适应滤波的概念 266

8.1.2 语音信号的噪声滤除 267

8.1.3 噪声滤除的算法 268

8.1.4 单频信号的分析 269

8.1.5 噪声滤除的效果 271

8.2 语音的HMM模型及其在语音识别中的应用 272

8.2.1 语音信号HMM的物理含义 272

8.2.2 实变信号HMM模型的建立和参数估计 273

8.2.3 HMM在语音识别中的应用 278

8.2.4 FHMM(Fuzzy-HMM)的相应算法 280

8.2.5 几种传统的识别系统 282

8.2.6 基于FVQ和FHMM多人通用孤立词识别系统 285

8.3 几种主要的VQ及聚类方法 288

8.3.1 K-Means算法 291

8.3.2 Binary-Split方法 292

8.3.3 MKM算法 293

8.3.4 “长轴”类分裂算法 294

8.3.5 FVQ方法简介 295

附录 关于计算机程序的说明 298

程序1 线性预测分析计算机程序(AUTO-COVAR) 299

程序2 数据的采样速率转换程序(SRO) 305

程序3 HMM模型的参数训练程序(trahm) 311

程序4 复倒谱聚类分析的计算机程序(MKMdmce) 318

参考文献 327

相关图书
作者其它书籍
返回顶部