目录 1
1.绪论 1
1.1 基本物理概念 1
1.2 语音信号波形举例 3
1.3 语音分析与合成模型 6
1.4 线性预测模型 10
1.5 各章综述 17
2.1 历史的回顾 20
2.方程式 20
2.2 最大似然法 22
2.3 最小方差 26
2.4 普罗尼(Prony)方法 28
2.5 相关匹配 34
2.6 部分相关(PARCOR) 36
2.6.1 内积与正交原理 38
2.6.2 PARCOR格型结构 41
3.解法和性质 46
3.1 引言 46
3.2 矢量空间和内积 48
3.2.1 滤波器或多项式的范数 50
3.2.2 内积的性质 51
3.2.3 正交关系 52
3.3 解法 55
3.3.1 相关矩阵 55
3.3.2 初始化 59
3.3.3 格雷姆-施密特正交化 60
3.3.4 利维森(Levinson)递推算法 61
3.3.5 修正Am(z) 62
3.3.6 调试举例 63
3.4 矩阵形式 65
4.声管模型 67
4.1 引言 67
4.2 声管公式推导 68
4.2.1 单节声管公式推导 69
4.2.2 连续性条件 72
4.2.3 边界条件 74
4.3 声管模型和线性预测的关系 78
4.4 算法、举例和评价 85
4.4.1 算法 86
4.4.2 举例 88
4.4.3 方法评价 90
4.5 唇阻抗估计 92
4.5.1 唇阻抗公式推导 93
4.6 展望 97
4.6.1 声管模型的损耗 97
4.6.2 声管模型的稳定性 99
5.1 引言 102
5.语音合成模型 102
5.2 稳定性 103
5.2.1 递增法 104
5.2.2 递减法 106
5.2.3 多项式性质 109
5.2.4 |Fm(Z)|的范围 110
5.2.5 稳定性的充要条件 112
5.2.6 应用 113
5.3 递推参数计算 114
5.3.1 内积特性 114
5.3.2 小结与程序 121
5.4 一种基本的合成模型 125
5.5 各种语音合成结构 130
5.5.1 直接式 130
5.5.2 双乘法格型模型 132
5.5.3 K-L模型 133
5.5.4 单乘法模型 135
5.5.5 归一化滤波器模型 137
5.5.6 调试举例 139
6.1 引言 143
6.频谱分析 143
6.2 频谱特性 144
6.2.1 零均值全极点模型 144
6.2.2 谱匹配的增益因子 145
6.2.3 谱匹配极限 147
6.2.4 非均匀谱加权 148
6.2.5 极小化最大谱匹配 151
6.3 谱平滑度模型 153
6.3.1 谱平滑度量度 154
6.3.2 谱平滑度变换式 156
6.3.3 数字计算 157
6.3.4 实验结果 158
6.3.5 激励函数模型 160
6.4 选择性线性预测 161
6.4.1 选择性线性预测(SLP)算法 163
6.4.2 一种选择性线性预测程序 165
6.4.3 计算问题 167
6.5 选择分析条件 167
6.5.1 方法的选择 168
6.5.3 滤波器阶数 170
6.5.2 取样率 170
6.5.4 选择分析间隔 173
6.5.5 加窗 174
6.5.6 预加重 175
6.6 谱估算技术 176
6.7 极点增强法 179
7.自动共振峰轨迹估算 182
7.1 引言 182
7.2 共振峰轨迹估算的方法 183
7.2.1 引言 183
7.2.2 从A(Z)中得到原始数据 185
7.2.3 原始数据举例 188
7.3 线性预测和倒谱平滑所得原始数据的比较 192
7.4 算法一 195
7.5 算法二 202
7.5.1 固定点的确定 203
7.5.2 每一浊音段的处理 203
7.5.3 最终平滑 206
7.5.4 结论 207
7.6 共振峰估算的准确度 208
7.6.1 合成语音分析实例 209
7.6.2 实际语音分析实例 210
7.6.3 语音周期的影响 211
8.基频估计 214
8.1 引言 214
8.2 谱平滑预处理 214
8.2.1 谱规则的浊音信号分析 215
8.2.2 谱不规则的浊音语音信号分析 218
8.2.3 STREAK方法 219
8.3.1 自相关分析 224
8.3 相关技术 224
8.3.2 修正自相关分析 226
8.3.3 滤波误差信号的自相关分析 228
8.3.4 一些实际考虑 230
8.3.5 SIFT方法 231
9.分析中的计算问题 239
9.1 引言 239
9.2 病态 239
9.2.1 病态条件的量度 241
9.2.3 取样前的预滤波 243
9.2.2 语音信号数据的预加重 243
9.3 线性预测分析的实现 244
9.3.1 自相关法 244
9.3.2 协方差法 245
9.3.3 计算的比较 250
9.4 有限字长的问题 251
9.4.1 有限字长系数的计算 252
9.4.2 方程的有限字长解 253
9.4.3 全部定字长的实现 254
10.2 技术 257
10.声码器 257
10.1 引言 259
10.2.1 系数转换 259
10.2.2 编码和解码 264
10.2.3 可变帧速率的传输 268
10.2.4 激励与合成增益的匹配 272
10.2.5 一种线性预测合成器的程序 276
10.3 低比特率音调激励声码器 280
10.3.1 最大似然度和部分相关(PARCOR)声码器 281
10.3.2 自相关法声码器 285
10.3.3 协方差法声码器 291
10.4 基带激励声码器 297
11.其他研究课题 300
11.1 讲话者的识别和证实 300
11.2 单字识别 303
11.3 喉部疾病的语声诊断 305
11.4 极点-零点估算 309
11.5 小结及进一步的研究方向 313
参考文献 316