语音信号处理PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:赵力等编著
- 出 版 社:北京:机械工业出版社
- 出版年份:2016
- ISBN:9787111534600
- 页数:282 页
第1章 绪论 1
第2章 语音信号处理的基础知识 5
2.1 语音发音及感知系统 5
2.1.1 语音发音系统 5
2.1.2 语音听觉系统 6
2.1.3 人耳听觉特性 7
2.2 语音信号生成的数学模型 10
2.2.1 激励模型 11
2.2.2 声道模型 12
2.2.3 辐射模型 15
2.2.4 语音信号的数字模型 15
2.3 语音基本概念与参数 16
2.3.1 声压与声强 16
2.3.2 响度 17
2.3.3 频率与音高 17
2.4 语音信号的数字化和预处理 17
2.4.1 预滤波、采样、A/D转换 18
2.4.2 预加重与去加重 18
2.5 语音信号处理的应用 19
2.6 思考与复习题 22
第3章 语音信号处理的常用算法 23
3.1 矢量量化 23
3.1.1 矢量量化的基本原理 23
3.1.2 矢量量化的失真测度 26
3.1.3 线性预测失真测度 27
3.1.4 识别失真测度 28
3.1.5 矢量量化器的最佳码本设计 29
3.2 隐马尔可夫模型 31
3.2.1 概述 31
3.2.2 隐马尔可夫模型的定义 34
3.2.3 隐马尔可夫模型的基本算法 36
3.2.4 隐马尔可夫模型的结构类型 41
3.3 神经网络 43
3.3.1 神经网络概述 43
3.3.2 人工神经网络的构成 45
3.3.3 神经网络模型及算法 47
3.3.4 基于神经网络的模式识别应用 52
3.4 思考与复习题 53
第4章 语音信号分析 55
4.1 概述 55
4.2 语音分帧 55
4.3 语音信号的时域分析 57
4.3.1 短时能量及短时平均幅度分析 58
4.3.2 短时过零率分析 59
4.3.3 短时相关分析 60
4.3.4 短时平均幅度差函数 63
4.4 语音信号的频域分析 64
4.4.1 利用短时傅里叶变换求语音的短时谱 65
4.4.2 语音的短时谱的临界带特征矢量 66
4.5 语音信号的倒谱分析 67
4.5.1 同态信号处理的基本原理 67
4.5.2 复倒谱和倒谱 68
4.5.3 Mel频率倒谱系数 70
4.6 语音信号的线性预测分析 72
4.6.1 线性预测分析的基本原理 72
4.6.2 线性预测方程组的求解 74
4.6.3 LPC谱估计和LPC复倒谱 76
4.6.4 线谱对(LSP)分析 78
4.6.5 LPC与LSP参数的转换 79
4.7 语音信号的小波分析 80
4.7.1 短时傅里叶变换 81
4.7.2 连续小波变换 81
4.7.3 离散小波变换 82
4.8 思考与复习题 84
第5章 语音信号特征提取技术 85
5.1 概述 85
5.2 端点检测 85
5.2.1 双门限法 85
5.2.2 自相关法 87
5.2.3 谱熵法 88
5.2.4 比例法 89
5.2.5 对数频谱距离法 90
5.3 基音周期估计 92
5.3.1 自相关法 92
5.3.2 平均幅度差函数法 95
5.3.3 倒谱法 96
5.3.4 简化逆滤波法 98
5.3.5 基音检测的后处理 99
5.4 共振峰估计 100
5.4.1 带通滤波器组法 101
5.4.2 倒谱法 102
5.4.3 线性预测法 102
5.5 思考与复习题 104
第6章 语音增强 105
6.1 概述 105
6.2 语音特性、人耳感知特性及噪声特性 105
6.2.1 语音特性 105
6.2.2 人耳感知特性 106
6.2.3 噪声特性 106
6.3 滤波器法 107
6.3.1 陷波器法 107
6.3.2 自适应滤波器 108
6.4 相关特征法 110
6.4.1 自相关处理抗噪法语音增强技术 110
6.4.2 利用复数帧段主分量特征的降噪方法 111
6.5 非线性处理法 112
6.5.1 小波降噪法 112
6.5.2 同态滤波法 113
6.6 减谱法 115
6.6.1 基本原理 115
6.6.2 基本减谱法的改进 116
6.7 Weiner滤波法 117
6.7.1 基本原理 117
6.7.2 Weiner滤波的改进形式 118
6.8 思考与复习题 118
第7章 语音识别 120
7.1 概述 120
7.2 语音识别原理和识别系统的组成 123
7.2.1 预处理和参数分析 124
7.2.2 语音识别系统构成 126
7.3 孤立字(词)识别系统 129
7.3.1 基于改进的二次分类函数的汉语塞音语音识别系统 130
7.3.2 基于动态时间规整(DTW)的孤立字(词)识别系统 132
7.3.3 基于概率尺度DP识别方法的孤立字(词)识别系统 134
7.3.4 基于隐马尔可夫模型(HMM)的孤立字(词)识别系统 135
7.4 连续语音识别系统 136
7.5 连续语音识别系统的性能评测 139
7.5.1 评测方法及系统复杂性和识别能力的测度 139
7.5.2 综合评估需要考虑的其他因素 142
7.6 思考与复习题 143
第8章 说话人识别 144
8.1 概述 144
8.2 说话人识别方法和系统结构 145
8.2.1 预处理 146
8.2.2 说话人识别特征的选取 146
8.2.3 特征参量评价方法 148
8.2.4 模式匹配方法 149
8.2.5 说话人识别中判别方法和阈值的选择 150
8.2.6 说话人识别系统的评价 151
8.3 应用VQ的说话人识别系统 151
8.4 应用DTW的说话人确认系统 153
8.5 应用HMM的说话人识别系统 154
8.5.1 基于HMM的与文本有关的说话人识别 154
8.5.2 基于HMM的与文本无关的说话人识别 155
8.5.3 基于HMM的指定文本型说话人识别 155
8.5.4 说话人识别HMM的学习方法 156
8.5.5 鲁棒的HMM说话人识别技术 156
8.6 应用GMM的说话人识别系统 157
8.6.1 GMM的基本概念 157
8.6.2 GMM的参数估计 157
8.6.3 训练数据不充分的问题 159
8.6.4 GMM模型的识别问题 159
8.7 尚需进一步探索的研究课题 160
8.8 思考与复习题 161
第9章 语音编码 163
9.1 概述 163
9.2 语音编码的评价指标 165
9.2.1 语音编码的依据 165
9.2.2 语音压缩系统的性能指标和评测方法 167
9.3 语音信号的波形编码 172
9.3.1 脉冲编码调制(PCM) 172
9.3.2 自适应预测编码(APC) 176
9.3.3 自适应增量调制和自适应差分脉冲编码调制 177
9.3.4 子带编码(SBC) 180
9.4 语音信号的参数编码 186
9.4.1 线性预测声码器 186
9.4.2 LPC-10编码器 188
9.5 语音信号的混合编码 191
9.6 思考与复习题 194
第10章 语音合成与转换 196
10.1 概述 196
10.2 语音合成算法 197
10.2.1 共振峰合成法 199
10.2.2 线性预测合成法 201
10.2.3 PSOLA算法合成语音 202
10.3 文语转换系统(TTS) 205
10.4 常用语音转换的方法 207
10.4.1 频谱特征参数转换 207
10.4.2 基音周期转换 209
10.4.3 韵律信息转换 210
10.5 语音转换的研究方向 211
10.6 思考与复习题 211
第11章 语音信号情感处理 213
11.1 概述 213
11.2 情感理论与情感诱发实验 214
11.2.1 情感的心理学理论 214
11.2.2 实用语音情感数据库的建立 215
11.2.3 情感语料的诱发方法 217
11.2.4 情感语料的主观评价方法 219
11.3 情感的声学特征分析 221
11.3.1 情感特征提取 221
11.3.2 特征降维算法 226
11.4 实用语音情感的识别算法研究 228
11.4.1 支持向量机 228
11.4.2 K近邻分类器 229
11.4.3 高斯混合模型的基本原理 230
11.5 跨语言的语音情感识别 232
11.6 应用与展望 233
11.6.1 载人航天中的应用的设想 233
11.6.2 情感多媒体搜索 234
11.6.3 个人机器人 235
11.6.4 总结与展望 235
11.7 思考与复习题 236
第12章 语音隐藏 237
12.1 概述 237
12.2 国内外研究现状及存在的问题 238
12.2.1 信息隐藏学科发展 238
12.2.2 语音信息隐藏国内外研究现状 239
12.2.3 存在的主要问题 240
12.3 语音信息隐藏基础 241
12.3.1 语音信息隐藏基本概念及理论 241
12.3.2 信息隐藏算法分类 242
12.3.3 信息隐藏技术应用 243
12.4 常用评价指标 244
12.4.1 感知透明性 244
12.4.2 鲁棒性 245
12.4.3 信息容量 246
12.5 基本语音信息隐藏算法 246
12.5.1 回声隐藏算法 246
12.5.2 相位编码算法 247
12.5.3 扩频算法 247
12.5.4 Patchwork算法 248
12.5.5 量化算法 249
12.6 总结与展望 249
12.7 思考与复习题 251
第13章 声源定位 252
13.1 概述 252
13.2 双耳听觉定位原理及方法 253
13.2.1 人耳听觉定位原理 253
13.2.2 人耳声源定位线索 255
13.2.3 声源估计方法 256
13.3 传声器阵列模型 258
13.3.1 均匀线阵 259
13.3.2 均匀圆阵 260
13.4 基于传声器阵列的声源定位算法分类 260
13.4.1 基于最大输出功率的可控波束形成算法 261
13.4.2 基于到达时间差的定位算法 262
13.4.3 基于高分辨率谱估计的定位算法 265
13.5 总结与展望 270
13.6 思考与复习题 271
附录 汉英名词术语对照 272
参考文献 280
- 《基于地质雷达信号波的土壤重金属污染探测方法研究》赵贵章 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《边缘处守望》山尹著 2019
- 《信号 修订版》铁道部通信信号公司研究设计院 1979
- 《《经典释文》的特殊读音与普通话语音规范》陈会兵著 2019
- 《烧结法处理非常规含铁资源研究》王哲著 2018
- 《无机元素原子光谱分析样品预处理技术》吴瑶庆 2019
- 《海南闽语对英语语音的负迁移研究》庞雅著 2019
- 《中国传统节日绘本故事 清明节 端午节 注音语音版》马玉玲编绘 2019
- 《农村生活污水处理工艺与技术应用》李灵娜著 2019
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019