语音处理及人机交互技术PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:张毅,刘想德,罗元等编
- 出 版 社:北京:科学出版社
- 出版年份:2016
- ISBN:9787030303240
- 页数:200 页
第1章 绪论 1
1.1 语音信号技术的历史 1
1.2 语音信号技术应用及新方向 3
1.2.1 语音信号的识别 3
1.2.2 语音信号的合成 4
1.2.3 语音信号的编码 4
参考文献 5
第2章 语音信号的声学基础 7
2.1 语音信号的产生 7
2.1.1 语音发音器官 7
2.1.2 语音声学特征 10
2.1.3 语音信号的时域及频域表示 11
2.1.4 汉语语音分类 13
2.1.5 汉语语音韵律特性 16
2.2 语音信号的感知 16
2.2.1 人的听觉系统 17
2.2.2 人耳的听觉特性 19
2.2.3 人耳听觉的掩蔽效应 20
2.3 语音信号生成的数学模型 26
2.3.1 激励模型 26
2.3.2 声道模型 28
2.3.3 辐射模型 30
2.3.4 语音信号的数学模型 31
2.4 语音产生的非线性模型 33
2.4.1 调频-调幅模型的基本原理 33
2.4.2 Teager能量算子 34
2.4.3 能量分离算法 34
2.4.4 调频-调幅模型的应用 36
参考文献 36
第3章 语音信号的分析 38
3.1 语音信号预处理步骤 38
3.1.1 采样与量化 38
3.1.2 预加重 39
3.1.3 分帧与加窗 40
3.1.4 端点检测 42
3.2 语音信号的时域分析 43
3.2.1 短时能量分析 44
3.2.2 短时平均过零率 44
3.2.3 短时自相关函数和短时平均幅度差函数 45
3.3 语音信号的频域分析 47
3.3.1 滤波器组方法 47
3.3.2 傅里叶频谱分析 48
3.3.3 线性预测倒谱系数 49
3.3.4 Mel频率倒谱系数 51
3.4 语音信号的倒谱分析 53
3.4.1 同态信号处理的基本原理 54
3.4.2 复倒谱和倒谱 56
3.5 语音信号的小波分析 57
参考文献 58
第4章 语音增强 60
4.1 语音信号与语音增强 60
4.1.1 语音特性 60
4.1.2 人耳感知特性 61
4.1.3 噪声特性 61
4.1.4 语音增强的信号模型 63
4.2 谱减法语音增强 64
4.2.1 基本原理 65
4.2.2 基本谱减法的改进 66
4.3 维纳滤波法语音增强 67
4.4 卡尔曼滤波法语音增强 68
4.5 最小均方误差法的语音增强 71
4.6 语音增强的一些新发展 73
参考文献 75
第5章 模式识别算法及应用 77
5.1 矢量量化的基本原理 77
5.2 矢量量化的失真测度 78
5.2.1 欧氏距离测度 79
5.2.2 线性预测失真测度 80
5.2.3 识别失真测度 81
5.3 人工神经网络的基本原理 81
5.4 人工神经网络的基本构成 83
5.4.1 人工神经元模型 83
5.4.2 神经网络有向图表示 85
5.4.3 神经网络结构及工作方式 86
5.5 基本神经网络模型及算法 87
5.5.1 单层感知器 87
5.5.2 多层感知器 90
5.5.3 径向基函数神经网络模型 92
5.5.4 循环神经网络 93
5.5.5 支持向量机 95
参考文献 98
第6章 语音信号的识别 99
6.1 语音识别概述 99
6.2 孤立词语音识别 100
6.3 连续词语音识别 102
6.4 说话人识别 103
6.4.1 说话人识别概述 103
6.4.2 说话人识别特征选取 103
6.4.3 说话人识别系统的结构 107
6.4.4 说话人识别中的识别方法 108
6.4.5 说话人识别中需进一步研究的问题 109
6.5 语音信号预处理 110
6.6 语音信号识别特征提取 111
6.7 语音信号识别方法 113
6.8 隐马尔可夫模型基本原理及在语音识别中的应用 114
6.8.1 马尔可夫链 114
6.8.2 隐马尔可夫模型的定义 115
6.8.3 隐马尔可夫模型的三个问题 115
6.8.4 隐马尔可夫模型在语音识别中的应用 118
6.9 动态时间规整算法 120
参考文献 122
第7章 语音信号的合成 123
7.1 概述 123
7.2 语音合成的基本方法 124
7.2.1 以单词为基础的合成方法 124
7.2.2 以音节为基础的合成方法 125
7.2.3 以音素为基础的合成方法 126
7.3 共振峰合成法 127
7.4 线性预测合成法 129
7.5 语音合成专用硬件介绍 132
7.6 PSOLA算法合成语音 134
7.7 文语转换系统 136
参考文献 138
第8章 语音信号定位与分离技术 140
8.1 声源定位技术 140
8.1.1 基于麦克风阵列的定位方法 140
8.1.2 基于人耳听觉机理的声源定位 143
8.2 语音分离技术 149
8.2.1 计算听觉场景分析 149
8.2.2 计算听觉场景分析的语音分离模型 154
8.2.3 独立分量分析 155
8.3 声源定位与语音分离实现方法 167
参考文献 169
第9章 基于听觉机制的语音识别 171
9.1 人耳的听觉机制 171
9.1.1 人耳听觉中枢的物理结构 171
9.1.2 人耳听觉中枢的听觉机理 172
9.2 人耳听觉系统的基本模型 172
9.2.1 人耳听觉系统的外周听觉模型 173
9.2.2 人耳听觉系统的内毛细胞模型 177
9.2.3 人耳听觉系统的重合神经元模型 181
9.3 多声源环境下人耳语音定位模型 183
9.3.1 双耳线索 183
9.3.2 耳廓效应 184
9.3.3 双耳时间差模型 185
9.3.4 多声源环境下声源定位系统的设计 185
9.4 多声源环境下人耳语音分离模型 188
9.4.1 语音信号分离的反演模型 188
9.4.2 语音信号分离系统的设计 189
9.5 基于听觉机制的语音识别系统 190
参考文献 191
第10章 基于语音的人机交互及应用 193
10.1 人机交互的研究及发展 193
10.1.1 人机交互概述 193
10.1.2 人机交互的研究内容 194
10.1.3 人机交互的发展历程 195
10.2 语音人机交互及其应用 196
10.2.1 语音人机交互概述 196
10.2.2 语音人机交互与智能轮椅 196
10.2.3 语音人机交互与智能电视 197
10.2.4 语音人机交互的其他应用 198
参考文献 199
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《Prometheus技术秘笈》百里燊 2019
- 《中央财政支持提升专业服务产业发展能力项目水利工程专业课程建设成果 设施农业工程技术》赵英编 2018
- 《药剂学实验操作技术》刘芳,高森主编 2019
- 《林下养蜂技术》罗文华,黄勇,刘佳霖主编 2017
- 《脱硝运行技术1000问》朱国宇编 2019
- 《催化剂制备过程技术》韩勇责任编辑;(中国)张继光 2019
- 《信息系统安全技术管理策略 信息安全经济学视角》赵柳榕著 2020
- 《香山设县850年》吴冉彬主编;中山市地方志办公室等编 2003
- 《应用型大学英语口语教程》张毅,王欣主编 2019
- 《晚霞风景 《晚霞》杂志创刊十周年作品选集》王诚德等编 1999
- 《行知工程创新教学探索系列 小学语文单元整体课程实施与评价》李怀源等编 2012
- 《诗文阅读入门》邵霭吉,戴永俊,朱桂元主编;王延潭,王学荣,王辉等编 1991
- 《全国精美作文年选 2009年度经典 高中卷》邵荣霞主编;邵荣霞,张年军,屠丽君等编 2010
- 《外科诊疗手册 新1版》裘法祖等编 1956
- 《数学分析习题课讲义 第2版 下册》谢惠民等编 2019
- 《日本经济现状研究》薛敬孝等编 1998
- 《黑龙江省主要野生药用植物的鉴别及中草药新制剂 第一部分》黑龙江省中草药进修班等编 1971
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《中医骨伤科学》赵文海,张俐,温建民著 2017
- 《美国小学分级阅读 二级D 地球科学&物质科学》本书编委会 2016
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《强磁场下的基础科学问题》中国科学院编 2020
- 《小牛顿科学故事馆 进化论的故事》小牛顿科学教育公司编辑团队 2018
- 《小牛顿科学故事馆 医学的故事》小牛顿科学教育公司编辑团队 2018
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019