语音信号处理PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:赵力编著
- 出 版 社:北京:机械工业出版社
- 出版年份:2003
- ISBN:711111762X
- 页数:316 页
第1章 绪论 1
第2章 语音信号处理的基础知识 5
2.1 概述 5
2.2 语音和语言 5
2.3 汉语语音学 10
2.3.1 汉语语音的特点 10
2.3.2 汉语的拼音方法 10
2.3.3 汉语音节的一般结构 10
2.3.4 汉语声母的结构 12
2.3.5 汉语韵母的结构 12
2.3.6 声母和韵母的相互作用——音征互载 13
2.3.7 汉语的声调 13
2.4.1 语音发音系统 14
2.4 语音生成系统和语音感知系统 14
2.4.2 语音听觉系统 16
2.5 语音信号生成的数学模型 20
2.5.1 激励模型 21
2.5.2 声道模型 22
2.5.3 辐射模型 24
2.5.4 语音信号的数学模型 25
2.6 语音信号的特性分析 26
2.6.1 语音信号的时域波形和频谱特性 26
2.6.2 语音信号的语谱图 27
2.6.3 语音信号的统计特性 29
思考与复习题 30
第3章 语音信号分析 31
3.1 概述 31
3.2 语音信号的数字化和预处理 31
3.2.2 预处理 32
3.2.1 预滤波、采样、A/D变换 32
3.3 语音信号的时域分析 35
3.3.1 短时能量及短时平均幅度分析 35
3.3.2 短时过零率分析 36
3.3.3 短时相关分析 38
3.3.4 短时平均幅度差函数 41
3.4 语音信号的频域分析 42
3.4.1 利用短时傅里叶变换求语音的短时谱 42
3.4.2 语音的短时谱的临界带特征矢量 44
3.5 语音信号的倒谱分析 45
3.5.1 同态信号处理的基本原理 45
3.5.2 复倒谱和倒谱 46
3.5.3 语音信号两个卷积分量的复倒谱 48
3.5.4 复倒谱分析中的相位卷绕及避免相位卷绕的算法 51
3.5.5 语音信号倒谱分析实例 53
3.6 语音信号的线性预测分析 56
3.6.1 线性预测分析的基本原理 56
3.6.2 线性预测方程组的求解 58
3.6.3 LPC谱估计和LPC复倒谱 62
3.6.4 线谱对(LSP)分析 64
3.7 基音周期估计 65
3.7.1 自相关法 66
3.7.2 平均幅度差函数法(AMDF) 69
3.7.3 并行处理技术(PPROC)方法 70
3.7.4 倒谱(CEP)法 71
3.7.5 简化逆滤波法(SIFT) 73
3.7.6 小波变换法 74
3.7.7 基音检测的后处理 75
3.8 共振峰估计 76
3.8.2 倒谱法 77
3.8.1 带通滤波器组法 77
3.8.3 LPC法 78
思考与复习题 80
第4章 矢量量化技术(VQ) 81
4.1 概述 81
4.2 矢量量化的基本原理 81
4.3 矢量量化的失真测度 84
4.3.1 欧氏距离测度 84
4.3.2 线性预测失真测度 85
4.3.3 识别失真测度 86
4.4 矢量量化器的最佳码本设计 87
4.4.1 LBG算法 87
4.4.2 初始码本的生成 88
4.5 矢量量化技术的优化设计 89
4.5.1 无记忆的矢量量化系统 90
4.5.2 有记忆的矢量量化系统 92
4.5.3 模糊矢量量化(Fuzzy VQ) 94
4.5.4 遗传算法优化码本——GAVQ算法 95
思考与复习题 97
第5章 隐马尔可夫模型(HMM) 98
5.1 概述 98
5.2 隐马尔可夫模型的引入 98
5.3 隐马尔可夫模型的定义 100
5.3.1 离散Markov过程 100
5.3.2 隐Markov模型 101
5.3.3 HMM的基本元素 101
5.4 隐马尔可夫模型的基本算法 103
5.4.1 前向-后向算法 104
5.4.2 维特比(Viterbi)算法 106
5.4.3 Baum-Welch算法 107
5.5.1 按照HMM的状态转移概率矩阵(A参数)分类 108
5.5 隐马尔可夫模型的各种结构类型 108
5.5.2 按照HMM的输出概率分布(B参数)分类 110
5.5.3 其他一些特殊的HMM的形式 114
5.6 隐马尔可夫模型的一些实际问题 115
5.6.1 下溢问题 115
5.6.2 参数的初始化问题 117
5.6.3 提高HMM描述语音动态特性的能力 119
5.6.4 HMM训练方法的改进 120
5.6.5 直接利用状态持续时间分布概率的HMM系统 123
思考与复习题 125
6.1 概述 127
6.2 人工神经网络简介 127
第6章 人工神经网络初步 127
6.3 人工神经网络的构成 128
6.3.1 神经元 129
6.3.2 神经元的学习算法 130
6.3.3 网络拓扑 130
6.3.4 网络的学习算法 130
6.4 几种用于模式识别的神经网络模型及其主要算法 131
6.4.1 单层感知器 131
6.4.2 双层感知器 132
6.4.3 多层感知器 133
6.4.4 径向基函数神经网络的分类特性 134
6.4.5 自组织特征映射模型 135
6.4.6 时延神经网络 136
6.4.7 循环神经网络 138
6.5.2 单输出型 139
6.5 用神经网络进行模式识别的典型做法 139
6.5.1 多输出型 139
6.6 人工神经网络模型的应用举例 140
思考与复习题 141
第7章 语音编码 142
7.1 概述 142
7.2 语音信号压缩编码的原理和压缩系统评价 144
7.2.1 语音压缩的基本原理 144
7.2.2 语音编码的关键技术 146
7.2.3 语音压缩系统的性能指标和评测方法 148
7.3 语音信号的波形编码 154
7.3.1 脉冲编码调制(PCM) 154
7.3.2 自适应预测编码(APC) 158
7.3.3 自适应增量调制(ADM)和自适应差分脉冲编码调制(ADPCM) 160
7.3.4 子带编码(SBC) 163
7.3.5 自适应变换编码(ATC) 168
7.4 语音信号的参数编码 171
7.4.1 线性预测声码器 171
7.4.2 LPC-10编码器 173
7.5 语音信号的混合编码 177
7.6 现代通信中的语音信号编码方法 179
7.6.1 EVRC算法基本原理 179
7.6.2 EVRC算法概述 180
思考与复习题 184
第8章 语音合成 185
8.1 概述 185
8.2 共振峰合成法 187
8.3 线性预测合成法 189
8.4 语音合成专用硬件简介 192
8.5 PSOLA算法合成语音 195
8.6 文语转换系统(TTS) 197
8.6.1 文语转换系统的组成 198
8.6.2 连读语音的韵律特性 199
8.6.3 文本分析方法 202
8.6.4 语音合成方法 204
8.6.5 语音合成中的韵律控制 208
思考与复习题 210
第9章 语音识别 212
9.1 概述 212
9.2 语音识别原理和识别系统的组成 215
9.2.1 预处理和参数分析 217
9.2.2 语音识别 219
9.2.3 语音识别系统的基本数据库 221
9.3 动态时间规整(DTW) 222
9.4 孤立字(词)识别系统 223
9.4.1 基于MQDF的汉语塞音语音识别系统 225
9.4.2 基于概率尺度DP识别方法的孤立字(词)识别系统 227
9.5 连续语音识别系统 228
9.6 连续语音识别系统的性能评测 231
9.6.1 连续语音识别系统的评测方法以及系统复杂性和识别能力的测度 231
9.6.2 综合评估连续语音识别系统时需要考虑的其他因素 234
思考与复习题 235
第10章 说话人识别与语种辨识 236
10.1 概述 236
10.2 说话人识别方法和系统结构 237
10.2.1 预处理 238
10.2.2 说话人识别特征的选取 238
10.2.3 特征参量评价方法 240
10.2.5 说话人识别中判别方法和阈值的选择 241
10.2.4 模式匹配方法 241
10.2.6 说话人识别系统的评价 242
10.3 应用DTW的说话人确认系统 243
10.4 应用VQ的说话人识别系统 244
10.5 应用HMM的说话人识别系统 245
10.5.1 基于HMM的与文本有关的说话人识别 246
10.5.2 基于HMM的与文本无关的说话人识别 246
10.5.3 基于HMM的指定文本型说话人识别 247
10.5.4 说话人识别HMM的学习方法 248
10.5.5 鲁棒的HMM说话人识别技术 248
10.6 应用GMM的说话人识别系统 249
10.6.1 GMM模型的基本概念 249
10.6.2 GMM模型的参数估计 249
10.6.3 训练数据不充分的问题 250
10.7 说话人识别中尚需进一步探索的研究课题 251
10.6.4 GMM模型的识别问题 251
10.8 语种辨识的原理和应用 253
10.8.1 语种辨识的基本原理和方法 253
10.8.2 语种辨识的应用领域 257
思考与复习题 257
第11章 语音信号中的情感信息处理 259
11.1 概述 259
11.2 语音信号中的情感分类和情感特征分析 259
11.2.1 情感的分类 259
11.2.2 情感特征分析 260
11.3 语音情感识别方法 265
11.3.1 主元分析法(PCA) 265
11.3.2 神经网络方法(ANN) 266
11.4 情感语音的合成 267
11.3.3 混合高斯模型法(GMM) 267
11.5 今后的研究方向 269
思考与复习题 270
第12章 语音增强 271
12.1 概述 271
12.2 语音特性、人耳感知特性及噪声特性 272
12.2.1 语音特性 272
12.2.2 人耳感知特性 272
12.2.3 噪声特性 273
12.3 滤波法语音增强技术 273
12.3.1 陷波器法 273
12.3.2 自适应滤波器 274
12.4 利用相关特性的语音增强技术 276
12.4.1 自相关处理抗噪法语音增强技术 276
12.4.2 利用复数帧段主分量特征的降噪方法 277
12.5 非线性处理法语音增强技术 278
12.5.1 中心削波法 278
12.5.2 同态滤波法 279
12.6 减谱法语音增强技术 280
12.6.1 基本原理 280
12.6.2 基本减谱法的改进 281
12.7 利用Weiner滤波法的语音增强技术 282
12.7.1 基本原理 282
12.7.2 Weiner滤波的改进形式 283
思考与复习题 283
附录A 语音信号LPC美尔倒谱系数(LPCMCC)分析程序 285
附录B 利用HMM的孤立字(词)语音识别程序 295
附录C 汉英名词术语对照 307
参考文献 315
- 《基于地质雷达信号波的土壤重金属污染探测方法研究》赵贵章 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《边缘处守望》山尹著 2019
- 《信号 修订版》铁道部通信信号公司研究设计院 1979
- 《《经典释文》的特殊读音与普通话语音规范》陈会兵著 2019
- 《烧结法处理非常规含铁资源研究》王哲著 2018
- 《无机元素原子光谱分析样品预处理技术》吴瑶庆 2019
- 《海南闽语对英语语音的负迁移研究》庞雅著 2019
- 《中国传统节日绘本故事 清明节 端午节 注音语音版》马玉玲编绘 2019
- 《农村生活污水处理工艺与技术应用》李灵娜著 2019
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019