当前位置:首页 > 工业技术
高维信息几何与语音分析
高维信息几何与语音分析

高维信息几何与语音分析PDF电子书下载

工业技术

  • 电子书积分:9 积分如何计算积分?
  • 作 者:曹文明,郑能恒,冯浩著
  • 出 版 社:北京:科学出版社
  • 出版年份:2011
  • ISBN:9787030303868
  • 页数:200 页
图书介绍:本书共三个部分,第一部分是介绍语音分析的常见研究方法,第二部分是高维信息几何基础知识,它主要介绍了高维信息几何的欧氏空间与高维信息几何线性代数基础理论基本算法,第三部分给出了高维信息几何理论及其算法在语音分析中的实际应用,它主要是提出了高维信息几何点覆盖理论及几何分析方法,对连续语音在高维空间中的种种表现形式加以探讨,给出了语音信息映射到高维空间后的分布概况。
上一篇:工程制图习题集下一篇:材料员
《高维信息几何与语音分析》目录

第1章 绪论 1

1.1 语音识别研究的重要意义 1

1.2 研究背景 3

1.2.1 国外语音识别研究的发展概况 3

1.2.2 汉语语音识别研究的发展概况 6

1.2.3 连续语音识别研究中遇到的挫折 7

1.3 连续语音识别的难点 10

1.3.1 连续语音的多变性和复杂性 10

1.3.2 高噪声环境下语音模型的不稳定性 10

1.3.3 连续语音识别技术的难点 10

1.4 连续语音识别问题的解决方法 12

1.4.1 传统的算法 12

1.4.2 本书采用的方法 13

1.5 本书的研究内容 14

第2章 语音的识别与处理方法概述 17

2.1 语音识别的分类 17

2.2 语音识别的基本步骤 19

2.3 语音的短时特性和窗函数 20

2.3.1 短时特性 20

2.3.2 窗函数 21

2.4 语音的特征提取 25

2.4.1 时域特征参数 25

2.4.2 频域特征参数 27

2.4.3 倒谱域特征参数 29

2.5 语音识别算法简介 32

2.5.1 动态时间弯折(DTW) 32

2.5.2 隐马尔可夫模型(HMM) 34

2.5.3 矢量量化(VQ) 37

2.5.4 人工神经网络(ANN) 38

第3章 隐马尔可夫模型与语音识别 39

3.1 马尔可夫链 39

3.2 隐马尔可夫模型 41

3.3 隐马尔可夫模型的基本算法 42

3.4 语音识别中的隐马尔可夫模型类型 47

3.5 基于隐马尔可夫模型的语音识别系统 49

3.6 混合高斯模型 50

3.7 基于声激励源与声道互补性信息的说话人识别 53

3.7.1 线性预测分析及声激励源信号提取 53

3.7.2 说话人特征参数的提取 55

3.7.3 WOCOR和MFCC区分不同说话人的性能分析 58

3.7.4 基于WOCOR和MFCC的说话人辨认实验 65

3.7.5 基于WOCOR和MFCC的说话人确认实验 69

3.8 总结与讨论 71

第4章 高维信息几何的欧氏空间 73

4.1 点的向量表示,向量的运算 73

4.2 n维欧氏空间 75

4.2.1 n维欧氏空间的有关概念与基本性质 75

4.2.2 基本图形的度量方程 80

4.3 变换 82

4.3.1 平移变换、合同变换、正交变换 82

4.3.2 变换的简单应用 84

4.3.3 基于高维空间几何点分布理论的图像复原算法 85

4.4 子空间、凸集、凸多胞形 95

4.4.1 子空间 95

4.4.2 凸集 96

4.4.3 凸多胞形 97

4.4.4 复杂几何体神经元 98

4.5 点距关系 101

4.6 同调连续性理论 105

4.6.1 同调连续原理 105

4.6.2 拓扑流形的训练与识别 107

4.7 小结 110

第5章 高维信息几何线性代数 111

5.1 n维欧氏空间公理化系统及基本性质 111

5.1.1 公理化系统 111

5.1.2 n维欧氏空间基本性质 112

5.2 基本几何术语及符号 113

5.3 点到平面及平面间距离 116

5.3.1 点到平面的距离 116

5.3.2 两平面间距离 117

5.4 平面间夹角 121

5.4.1 直线与平面间夹角 121

5.4.2 两平面间夹角 122

5.4.3 两平面及其夹角 125

5.5 k_平行四边形:k_矢量 125

5.5.1 Rn中矢量的线性相关或独立的测试 126

5.5.2 k_平行四边形的k_维体积 127

5.5.3 k_矢量 128

5.6 k_单形几何学和三角学 131

5.6.1 k_单形的k_维体积 131

5.6.2 Dihedral角 132

5.6.3 投影定律 133

5.6.4 余弦定律 134

5.6.5 正弦定律 136

5.7 重心坐标 137

5.7.1 Rn的点在重心坐标和直角坐标之间的变换 139

5.7.2 n_单形在重心坐标下的体积及其应用 141

5.7.3 在重心坐标下两点之间的距离 143

5.7.4 重心、内心和外接球心 145

5.8 点覆盖 147

5.8.1 覆盖 147

5.8.2 覆盖比 147

5.8.3 局部顶点覆盖 150

5.8.4 覆盖积 150

5.9 主元分析法及其高维空间几何意义 151

5.9.1 主元分析法简介 151

5.9.2 主元分析法的高维空间几何意义 153

5.10 语音在高维空间中的形态分析 153

5.10.1 语音点在高维空间中的分布概况 154

5.10.2 不同类语音覆盖区的覆盖方法 158

5.10.3 采用点覆盖方法的优点 159

第6章 基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别 160

6.1 数字语音分析 160

6.2 连续数字语音识别的特征提取方法和高维空间分类覆盖区的神经网络构筑 161

6.2.1 构筑神经网络所用样本库的建立 161

6.2.2 构筑神经网络所用样本的特征提取方法 162

6.2.3 构造特征空间识别覆盖区 164

6.3 高维空间语音搜索算法及实现 164

6.3.1 被识别的连续语音样本库的建立 164

6.3.2 被识别的连续语音样本的特征提取方法 165

6.3.3 高维空间点覆盖动态搜索识别方法 165

6.4 实验结果与讨论 168

6.4.1 本实验的统计结果与讨论 168

6.4.2 与隐马尔可夫模型方法的比较结果及讨论 169

第7章 基于多权值神经网络的语音情感识别及其比较 176

7.1 情感类型的划分 176

7.2 语音情感特征的选择和提取 177

7.3 语音情感识别所用的样本库的建立 177

7.4 多权值神经网络的构建与识别过程 178

7.4.1 多权值神经网络的构建具体算法描述 178

7.4.2 多权值神经网络的识别 179

7.5 实验结果与讨论 180

7.5.1 本实验的统计结果与讨论 180

7.5.2 与SVM模型的比较结果 185

7.6 小结 191

参考文献 192

返回顶部