第一章 概论 1
1.1 语言发声类型 2
1.2 中国语言的发声类型 3
1.3 发声类型的语音学研究 4
1.4 发声类型的研究方法 5
1.5 发声类型研究的意义 6
1.6 章节安排 8
2.1 喉头的软骨和韧带 10
第二章 发声的生理和声学基础 10
图2.2 喉头软骨和韧带基本构造的侧视图(Titze,1994) 11
插图图2.1 喉头软骨和韧带基本构造的前视图(Titze,1994) 11
2.2 喉头肌肉的构造 12
图2.3 喉头软骨和韧带基本构造的后视图(Titze,1994) 12
图2.4 喉头肌肉基本构造的后侧视图(Titze,1994) 13
图2.5 喉头肌肉基本构造的侧视图(Titze,1994) 14
图2.6 喉头肌肉基本构造的俯视图(声带位置的横断面)(Titze,1994) 14
2.3 喉头中的皱褶 15
图2.7 喉头皱褶基本构造的后视图(Titze,1994) 15
图2.8 声带基本构造的剖面图(Titze,1994) 16
2.4 声带的构造 16
图2.9 正常发声的声门开合状态 17
2.5 声门的基本状态 17
图2.10 低音调发声的声门开合状态 18
图2.11 高音调发声的声门开合状态 18
图2.13 吸气音的声门开合状态 19
图2.12 假声的声门开合状态 19
图2.14 气泡音的声门开合状态 20
2.6 嗓音的声学模型 20
图2.15 Rosenberg、Hedelin和Fant的声学模型(Hardcastle et al,1997) 21
图2.16 Fant和Ananthapadmanabha的声学模型(Hardcastle et al,1997) 21
图2.17 Fant和Ljungqvist等的声学模型(Hardcastle et al,1997) 21
3.1 谐波差值分析 23
第三章 发声的研究方法 23
图3.1 一个高频能量比较高的嗓音 24
图3.2 一个高频能量比较低的嗓音 24
图3.3 景颇语松元音[a]的功率谱 25
图3.4 景颇语紧元音[?]的功率谱 26
图3.5 哈尼语松元音[a]的功率谱 26
图3.6 哈尼语紧元音[?]的功率谱 26
3.2 线性预测与逆滤波 27
图3.7 表示[a]声道极点的单位圆示意图 28
图3.8 元音[a]的共振峰示意图 28
图3.9 语音信号和两种逆滤波后的声源信号 29
3.3 频谱的下降率或倾斜 30
图3.11 经过逆滤波的声源谱包络 30
图3.10 元音[a]的共振峰包络 30
图3.12 一个典型的声门脉冲及其频谱 31
图3.13 一个典型的女声高音调声门脉冲及其频谱 32
3.4 声源信号的微分处理 32
图3.14 EGG信号及其微分形式 33
图3.15 经逆滤波得到的声源信号及其微分形式 33
图3.16 J层的二阶离散小波变换 35
3.5 小波变换分析 35
图3.17 J层二阶离散小波的反变换 36
表格表3.1 对应于1-D二次分裂小波的限定性脉冲响应滤波的滤波系数 36
图3.18 小波变换示意图 37
图3.19 从小波变换的局部最大值测定声带接触点和开启点示意图 37
图3.21 从小波系数局部最大值恢复小波系数 38
图3.20 由小波系数局部最大值检测基频 38
图3.22 利用修改后的小波系数合成语音 39
3.6 多维嗓音分析 40
3.7 高速数字成像研究 44
图3.23 高速数字成像系统示意图 45
图3.24 64帧经过处理后的高速数字图像 50
图3.25 从高速数字图像中提取的参数示意图 51
3.8 相关特征分析 51
第四章 发声音质与调音音质(一):哈尼语的发声类型 53
4.1 哈尼语的松紧元音 53
4.2 哈尼语发声类型的研究方法 55
4.3 松紧元音的声学分析 56
图4.2 紧元音[?]的功率谱 57
图4.1 松元音[a]的功率谱 57
表4.2 松紧元音四个断面谐波振幅数据表 58
图4.3 哈尼语松紧元音差值示意图 58
表4.1 松紧元音参数表 58
图4.4 哈尼语松紧元音四个不同断面差值示意图 60
表4.3 松紧元音共振峰参数表 61
图4.5 哈尼语10对松紧元音F1和F2数值示意图 61
图4.6 松紧元音声学元音图 62
表4.4 辅音参数表 63
图4.7 哈尼语辅音松紧差值示意图 63
表4.5 辅音参数表 64
图4.8 哈尼语辅音松紧差值示意图 64
4.4 哈尼语发声类型的性质 65
4.5 发声音质与调音音质的概念 66
表4.6 发声音质和调音音质组合表 67
5.1 浊送气研究 69
第五章 发声音质与调音音质(二):苗语的浊送气嗓音 69
5.2 石门坎苗语 70
表5.1 清音、清送气音和浊音、浊送气音对立的例词表 72
5.3 苗语的浊辅音 72
图5.1 清声母音节[tau7]、清送气声母音节[thau7]、浊声母音节[dau7]和浊送气声母音节[d?au4]声母的语图 73
5.4 VOT的特性 73
表5.2 塞音VOT数据表,其中?为平均 74
表5.3 塞擦音VOT数据表 75
5.5 功率谱 75
图5.2 音节/nta3/一个断面的功率谱 76
图5.3 音节/ntha3/一个断面的功率谱 76
图5.5 音节/nd?a8/一个断面的功率谱 76
图5.4 音节/nda6/一个断面的功率谱 76
表5.4 苗语/nta3/、/ntha3/、/nda6/和/nd?a8/韵母六个断面第一、二谐波的差值数据 77
5.6 苗语的音长 78
图5.6 苗语/nta3/、/ntha3/、/nda6/和/nd?a8/韵母六个断面第一、二谐波的差值示意图 78
表5.5 浊声母音节和浊送气声母音节时长数据表 79
图5.7 浊声母音节和浊送气声母音节时长示意图 79
表5.6 清声母音节、清送气声母音节、浊声母音节和浊送气声母音节基频参数对比表 80
5.7 苗语的声调 80
图5.8 清声母音节(1)、清送气声母音节(2)、浊声母音节(3)和浊送气声母音节(4)基频参数示意图 81
图5.9 浊声母音节(1,3,5,7)和浊送气声母音节(2,4,6,8)基频参数示意图 82
5.8 苗语浊送气的性质 83
6.1 凉山彝语的语音 85
第六章 发声与声道:凉山彝语的松紧嗓音 85
6.2 凉山彝语的松紧元音 86
6.3 研究方法 88
表6.1 彝语松紧元音例词 88
6.4 元音的调音音质 89
表6.2 松紧元音共振峰及基频参数 89
6.5 松紧元音的性质 90
图6.1 彝语松紧元音声学元音图 90
表6.3 松紧元音第一、二谐波和第一、二共振峰幅值关系参数 91
图6.2 松紧元音第一、二谐波和第一、二共振峰幅值参数关系示意图(元音的顺序和每对元音的幅值关系的顺序见数据表6.3) 92
6.6 松紧元音的声道特性 94
图6.5 松紧元音/o/和/?/的声道侧视图 95
图6.3 松紧元音/u/和/?/的声道侧视图 95
图6.4 松紧元音/l/和/?/的声道侧视图 95
图6.6 松紧元音/?/和/?/的声道侧视图 95
图6.7 松紧元音/i/和/?/的声道侧视图 96
6.7 松紧嗓音的谱特性 97
图6.9 松紧元音/?/和/?/的频谱能量分布 98
表6.4 松紧元音频谱能量分布参数 98
6.8 研究结果 98
图6.8 松紧元音/u/和/?/的频谱能量分布 98
6.9 语言学意义 99
第七章 发声与声母:阿细彝语的松紧嗓音 101
7.1 阿细彝语及其松紧元音 101
7.2 声学参数的提取 102
7.3 阿细彝语松紧元音的性质 103
图7.1 松紧元音第一、二谐波幅值参数及差值示意图 104
表7.1 松紧元音第一、二谐波幅值参数 104
7.4 松紧元音与调音 106
表7.2 松紧元音共振峰参数 106
图7.2 松紧元音共振峰参数示意图 107
7.5 松紧元音与声调 108
表7.3 松紧元音基频参数及差值 108
7.6 松紧与声母 109
图7.3 松紧元音基频参数示意图 109
图7.4 松紧声母参数示意图 110
表7.4 松紧元音声母参数 110
7.8 松紧声母 111
7.7 阿细彝语嗓音的性质 111
第八章 发声与韵母:载佤语的发声类型 113
8.1 载瓦语的语音结构 113
8.2 参数提取 114
表8.1 单元音第一、二谐波差值和松紧音差值 115
8.3 单元音的嗓音性质 115
8.4 元音韵尾的嗓音性质 116
图8.1 单元音第一、二谐波差值和松紧音差值示意图 116
表8.2 元音韵尾第一、二谐波差值和松紧音差值 116
8.5 鼻音韵尾的嗓音性质 117
图8.2 元音韵尾第一、二谐波差值和松紧音差值示意图 117
表8.3 鼻音韵尾第一、二谐波差值和松紧音差值 117
8.6 塞音韵尾的嗓音性质 118
表8.4 塞音韵尾第一、二谐波差值和松紧音差值 118
图8.3 鼻音韵尾第一、二谐波差值和松紧音差值示意图 118
表8.5 浊声母第一、二谐波差值和松紧音差值 119
图8.4 塞音韵尾第一、二谐波差值和松紧音差值示意图 119
8.7 浊声母的嗓音性质 119
8.8 逆滤波分析和谱倾斜 120
图8.6 松音的LPC谱包络 120
图8.7 紧音的LPC谱包络 120
图8.5 浊声母第一、二谐波差值和松紧音差值示意图 120
图8.9 松音的平均功率谱 121
图8.10 紧音平均的LPC谱包络 121
图8.11 紧音的平均功率谱 121
图8.8 松音平均的LPC谱包络 121
8.9 载佤语松紧元音的性质 122
8.10 韵母与发声类型 123
9.1 景颇语及其松紧元音 124
第九章 发声音质与声调音质:景颇语的松紧嗓音 124
表9.1 单元音韵母松紧元音的参数 126
9.2 松紧元音的性质 126
表9.2 二合元音韵母松紧元音的参数 127
表9.3 带鼻尾韵母的松紧元音参数 128
表9.4 带塞音韵尾的松紧元音参数 129
图9.1 单元音韵母音节 130
图9.2 二合元音韵母音节 130
图9.4 带塞音韵尾音节 131
图9.3 带鼻音韵尾音节 131
9.3 嗓音声源的谱倾斜特性 132
图9.5 松音/ka31/的声源谱 132
图9.6 紧音/k?31/的声源谱 133
9.4 基频与嗓音 133
图9.8 /ka31/和/k?31/的基频 134
图9.7 /po33/和/p?33/的基频 134
图9.10 /pau33/和/p?33/的基频 135
图9.9 /pu31/和/p?31/的基频 135
图9.12 /ton31/和/t?31/的基频 136
图9.11 /tom31/和/t?31/的基频 136
图9.13 /kjip31/和/kj?p31/的基频 137
9.5 松紧元音的调音音质 137
表9.5 松紧元音第一、二共振峰参数 138
图9.14 景颇语松紧元音声学元音图 138
9.6 声调与发声 139
第十章 多维嗓音分析 141
10.1.1 男女声多维嗓音相关分析 142
10.1 多维嗓音相关分析 142
表10.1 男声主要嗓音参数均值和标准差 143
表10.2 女声主要嗓音参数均值和标准差 144
10.1.2 元音多维嗓音相关分析 144
10.1.3 音调多维嗓音相关分析 145
表10.3 男声音调嗓音特征相关数据表 145
表10.4 男声音调嗓音特征相关数据表 146
表10.5 基频基础参数数据表表中pname是人名,M代表男声,F代表女声,fname是文件名,vaal-vaa5表示持续元音五个不同音调的[a],以下各表相同 147
10.2 多维嗓音特征分析 147
10.2.1 基音基础特性 147
图10.1 平均基频、最高基频和最低基频的示意图 148
图10.3 基频标准差和基频半音范围参数示意图 149
图10.2 平均音调周期参数示意图 149
10.2.2 频率抖动特性 150
表10.6 基频抖动频率和分析样本时长数据 150
图10.4 基频抖动频率和分析样本时长数据 151
表10.7 绝对频率抖动、频率抖动百分比、相对平均扰动、音调扰动商、平滑音调扰动商和基频变化率数据 151
图10.6 相对平均扰动、音调扰动商、平滑音调扰动商和基频变化率数据示意图 152
图10.5 绝对频率抖动和频率抖动百分比数据示意图 152
10.2.3 振幅抖动特性 153
表10.8 振幅抖动、振幅抖动百分比、振幅扰动商、平滑振幅扰动商和振幅变化率数据 153
表10.9 清浊率、嗓音骚动、软发声指数和基频抖动强度指数参数 154
10.2.4 嗓音指数特性 154
图10.7 振幅抖动、振幅抖动百分比、振幅扰动商、平滑振幅扰动商和振幅变化率数据示意图 154
图10.8 软发声指数和基频抖动强度指数示意图 155
图10.9 清浊率、嗓音骚动示意图 155
表10.10 嗓音破裂级、次和谐级、清声级、嗓音破裂数、次和谐音段数和非浊音段数数据 156
10.2.5 嗓音清化特性 156
图10.10 嗓音破裂级、次和谐级、清声级和嗓音破裂数参数示意图 157
图10.11 次和谐音段数和非浊音段数据示意图 157
10.3 多维嗓音研究的意义 157
11.1 嗓音与音调 159
第十一章 嗓音的开商和速度商 159
11.2 基本研究方法 160
11.3 基频的性质 161
图11.2 女声音调参数示意图 162
图11.1 男声音调参数示意图 162
图11.4 男女标准差和基频抖动参数示意图 163
图11.3 男女平均音调参数示意图 163
表11.1 音调参数数据表 164
11.4 速度商的性质 164
图11.5 男声速度商参数示意图 165
图11.6 女声速度商参数示意图 165
图11.7 男女声平均速度商参数示意图 166
图11.8 男女声基频和速度商参数示意图 166
表11.2 男女声速度商参数 167
图11.9 男声开商参数示意图 168
11.5 开商的性质 168
图11.10 女声开商参数示意图 169
图11.11 男女声开商参数示意图 169
图11.12 男女声开商参数示意图 170
11.6 嗓音的基本性质 171
表11.3 男女声开商参数 171
第十二章 发声类型的基本特性与区别性特征 173
12.1 中国语言的发声类型 173
12.2 研究方法 174
12.3 音调与嗓音的关系 174
图12.1 元音/a/参数的示意图 175
图12.2 元音/i/参数的示意图 175
图12.3 元音/u/参数的示意图 176
图12.4 元音[a]、[i]和[u]平均参数的示意图 176
表12.1 不同元音平均参数 177
图12.5 基频抖动参数示意图 177
图12.6 开商参数示意图 178
12.4 不同的发声类型 178
图12.7 气泡音平均参数示意图(pmean和omean两条线几乎重合) 179
表12.2 气泡音平均参数 179
12.4.1 气泡音 179
图12.8 气嗓音平均参数示意图 180
12.4.2 气嗓音 180
表12.3 气嗓音平均参数 180
表12.4 紧喉音平均参数 181
图12.9 紧喉音平均参数示意图 181
12.4.3 紧喉音 181
12.4.4 正常嗓音 182
表12.5 正常嗓音不同元音平均参数 182
图12.10 正常嗓音不同元音平均参数示意图 182
表12.6 高音调嗓音不同元音的平均参数 183
12.4.5 高音调嗓音 183
图12.11 高音调嗓音不同元音的平均参数示意图 183
12.5 嗓音的区别性特征 184
图12.12 不同嗓音平均参数示意图 184
图12.13 不同嗓音平均开商示意图 185
表12.7 不同嗓音平均参数 185
图12.15 不同嗓音平均速度商示意图 186
图12.14 不同嗓音平均抖动示意图 186
13.1 汉语声调的研究 190
第十三章 汉语声调的发声模式 190
13.2 汉语声调的发声研究 191
图13.1 汉语基频、速度商和开商关系示意图 192
13.3 声调发声的研究方法 193
13.4 单音节声调模式 194
图13.2 (a)是第一调F0和速度商的参数,(b)是第一调开商的参数 194
图13.3 (a)是第二调F0和速度商的参数,(b)是第二调开商的参数 195
图13.4 (a)是第三调F0和速度商的参数,(b)是第三调开商的参数 195
图13.5 (a)是第四调F0和速度商的参数,(b)是第四调开商的参数 196
图13.6 (a)为双字词声调11组合的基频和速度商,(b)为双字词声调11组合的开商 197
13.5.1 第一组双音节声调模式 197
图12.16 不同嗓音平均基频示意图 197
13.5 双音节声调模式 197
图13.9 (a)为双字词声调14组合的基频和速度商,(b)为双字词声调14组合的开商 198
图13.8 (a)为双字词声调13组合的基频和速度商,(b)为双字词声调13组合的开商 198
图13.7 (a)为双字词声调12组合的基频和速度商,(b)为双字词声调12组合的开商 198
图13.10 (a)为双字词声调21组合的基频和速度商,(b)为双字词声调21组合的开商 199
13.5.2 第二组双音节声调模式 199
图13.11 (a)为双字词声调22组合的基频和速度商,(b)为双字词声调22组合的开商 200
图13.12 (a)为双字词声调23组合的基频和速度商,(b)为双字词声调23组合的开商 200
图13.13 (a)为双字词声调24组合的基频和速度商,(b)为双字词声调24组合的开商 200
图13.14 (a)为双字词声调31组合的基频和速度商,(b)为双字词声调31组合的开商 201
13.5.3 第三组双音节声调模式 201
图13.15 (a)为双字词声调32组合的基频和速度商,(b)为双字词声调32组合的开商 202
图13.17 (a)为双字词声调34组合的基频和速度商,(b)为双字词声调34组合的开商 202
图13.16 (a)为双字词声调33组合的基频和速度商,(b)为双字词声调33组合的开商 202
13.5.4 第四组双音节声调模式 203
图13.18 (a)为双字词声调41组合的基频和速度商,(b)为双字词声调41组合的开商 203
图13.20 (a)为双字词声调43组合的基频和速度商,(b)为双字词声调43组合的开商 204
图13.21 (a)为双字词声调44组合的基频和速度商,(b)为双字词声调44组合的开商 204
图13.19 (a)为双字词声调42组合的基频和速度商,(b)为双字词声调42组合的开商 204
13.6.1 F0模式的区别性特征 205
13.6 双音节声调模式的区别性特征 205
表13.1 基于区别性特征的双字词基频模式 206
13.6.2 速度商模式的区别性特征 206
表13.2 基于区别性特征的双字词速度商模式 207
13.6.3 开商模式的区别性特征 207
表13.3 基于区别性特征的双字词开商模式 208
13.7 基于嗓音的声调模型 209
14.1 正常嗓音 211
第十四章 发声类型的动态声门 211
图14.1(a) 男声24帧正常嗓音的高速数字图像 212
图14.1(b) 男声正常嗓音13种参数的曲线示意图 213
图14.2(a) 女声24帧正常嗓音的高速数字图像 214
图14.2(b) 女声正常嗓音13种参数的曲线示意图 214
表14.1(a)(b) 男女声正常嗓音的10个统计参数 215
图14.3 利用敞开模式提取的女声正常嗓音的参数示意图 215
14.2 高音调和低音调嗓音 216
图14.4(a) 24帧女声高音调声门的数字图像 217
图14.4(b) 64帧漏气模式提取的女声高音调声门参数曲线图 217
图14.5 64帧敞开模式提取的女声高音调声门参数曲线图 218
图14.6(a) 24帧男声低音调声门的数字图像 219
图14.6(b) 64帧男声低音调声门参数曲线图 219
表14.2(a)(b) 高低音调嗓音10个统计参数 220
14.3 假声 221
图14.7(a) 24帧女声假声的声带数字图像 221
表14.3(a)(b) 假声和气泡音10个统计参数 222
图14.7(b) 64帧女声假声声带参数曲线图 222
14.4 气泡音 223
图14.8(a) 典型的男声气泡音数字图像 224
图14.8(b) 典型男声气泡音13项参数曲线图 225
图14.9(a) 24帧男声特殊气泡音高速数字图像 225
图14.9(b) 男声特殊气泡音13项参数曲线图 226
14.5 气嗓音 226
图14.10(a) 24帧男声气嗓音高速数字图像 227
图14.10(b) 128帧气嗓音参数曲线示意图 227
14.6 双音调嗓音 228
图14.11(a) 24帧双音调嗓音的高速数字图像 229
图14.11(b) 192帧双音调嗓音的13项参数的曲线图 229
图14.12(b) 640帧漏气模式参数的曲线示意图 230
图14.12(a) 192帧漏气模式参数的曲线图 230
14.7 吸气音 231
图14.13(a) 24帧女声吸气音的高速数字图像 232
表14.4(a)(b) 气嗓音、双音调嗓音和吸气音10项参数 233
图14.13(b) 128帧吸气音的参数示意图 233
14.8 动态声门研究 234
第十五章 汉语声调的动态声门 235
图15.1 第一调(董01)分三部分,用a、b和c三张图表示,每张图显示了从高速数字图像中提取的13项参数 236
15.1 高平调(董01) 236
图15.2 第一调基频(F0)和经过多项式曲线拟合的基频(F0*) 238
图15.4 第一调速度商(SQ)和经过多项式曲线拟合的速度商(SQ*) 239
图15.3 第一调开商(0Q)和经过多项式曲线拟合的开商(0Q*) 239
图15.5 第一调声门形状比(RSH)和经过多项式曲线拟合的声门形状比(RSH*) 240
表15.1(a)(b) 第一调(董01)的4个动态声门参数和多项式曲线拟合后的参数 240
15.2 高平调(丘01) 241
图15.6 第一调(丘01)分三部分,用a、b和c三张图表示,每张图显示了从高速数字图像中提取的13项参数 242
图15.8 第一调开商(0Q)和经过多项式曲线拟合的(0Q*) 243
图15.7 第一调基频(F0)和经过多项式曲线拟合的基频(F0*) 243
图15.9 第一调速度商(SQ)和经过多项式曲线拟合的速度商(SQ*) 244
图15.10 第一调声门形状比(RSH)和经过多项式曲线拟合的声门形状比(RSH*) 244
表15.2(a)(b) 第一调(丘01)的4个动态声门参数和多项式曲线拟合后的参数 245
图15.11 第二调(董02)分三部分,用a、b和c三张图表示,每张图显示了从高速数字图像中提取的13项参数 246
15.3 上升调(董02) 246
图15.13 第二调开商(0Q)和经过多项式曲线拟合的开商(0Q*) 247
图15.12 第二调基频(F0)和经过多项式曲线拟合的基频(F0*) 247
图15.14 第二调速度商(SQ)和经过多项式曲线拟合的速度商(SQ*) 248
图15.15 第二调声门形状比(RSH)和经过多项式曲线拟合的声门形状比(RSH*) 248
表15.3(a)(b) 第二调(董02)的4个动态声门参数和多项式曲线拟合后的参数 249
图15.16 第二调(丘02)分三部分,用a、b和c三张图表示,每张图显示了从高速数字图像中提取的13项参数 250
15.4 上升调(丘02) 250
图15.17 第二调基频(F0)和经过多项式曲线拟合的基频(F0*) 251
图15.18 第二调开商(0Q)和经过多项式曲线拟合的开商(0Q*) 252
图15.19 第二调速度商(SQ)和经过多项式曲线拟合的速度商(SQ*) 252
图15.20 第二调声门形状比(RSH)和经过多项式曲线拟合的声门形状比(RSH*) 253
表15.4(a)(b) 第二调(丘02)的4个动态声门参数和多项式曲线拟合后的参数 253
15.5 低降升调(董03) 254
图15.21 第三调(董03)分五部分,用a、b、c、d和e五张图表示,每张图显示了从高速数字图像中提取的13项参数 255
图15.22 第三调基频(F0)和经过多项式曲线拟合的基频(F0*) 256
图15.23 第三调开商(0Q)和经过多项式曲线拟合的开商(0Q*) 256
图15.24 第三调速度商(SQ)和经过多项式曲线拟合的速度商(SQ*) 257
图15.25 第三调声门形状比(RSH)和经过多项式曲线拟合的声门形状比(RSH*) 257
表15.5(a)(b) 第三调(董03)的4个动态声门参数和多项式曲线拟合后的参数 258
15.6 低降调(丘03) 259
图15.26 第三调(丘03)分三部分,用a、b和c三张图表示,每张图显示了从高速数字图像中提取的13项参数 259
图15.28 第三调开商(0Q)和经过多项式曲线拟合的开商(0Q*) 260
图15.27 第三调基频(F0)和经过多项式曲线拟合的基频(F0*) 260
图15.30 第三调声门形状比(RSH)和经过多项式曲线拟合的声门形状比(RSH*) 261
图15.29 第三调速度商(SQ)和经过多项式曲线拟合的速度商(SQ*) 261
表15.6(a)(b) 第三调(丘03)的4个动态声门参数和多项式曲线拟合后的参数 262
15.7 高降调(董04) 263
图15.31 第四调(董04)分三部分,用a、b和c三张图表示,每张图显示了从高速数字图像中提取的13项参数 263
图15.32 第四调基频(F0)和经过多项式曲线拟合的基频(F0*) 264
图15.33 第四调开商(0Q)和经过多项式曲线拟合的开商(0Q*) 264
图15.34 第四调速度商(SQ)和经过多项式曲线拟合的速度商(SQ*) 265
图15.35 第四调声门形状比(RSH)和经过多项式曲线拟合的声门形状比(RSH*) 265
表15.7(a)(b) 第四调(董04)的4个动态声门参数和多项式曲线拟合后的参数 266
图15.36 第四调(丘04)分三部分,用a、b和c三张图表示,每张图显示了从高速数字图像中提取的13项参数 267
15.8 高降调(丘04) 267
图15.38 第四调开商(0Q)和经过多项式曲线拟合的开商(0Q*) 268
图15.37 第四调基频(F0)和经过多项式曲线拟合的基频(F0*) 268
图15.39 第四调速度商(SQ)和经过多项式曲线拟合的速度商(SQ*) 269
图15.40 第四调声门形状比(RSH)和经过多项式曲线拟合的声门形状比(RSH*) 269
表15.8(a)(b) 第四调(丘04)的4个动态声门参数和多项式曲线拟合后的参数 270
15.9 汉语声调动态声门的性质 271
第十六章 基于发声的语音学理论框架 274
16.1 言语产生的语音学理论 274
16.1.2 辅音的描写和定义 275
16.1.1 元音的描写和定义 275
16.2 言语产生的声学理论 276
16.1.3 嗓音发声的描写和定义 276
16.1.4 语音学描写和生理描写 276
16.2.1 言语产生的声学框架 277
图16.1 言语产生的三个部分和过程(Hardcastle et al,1997) 278
图16.2 言语产生和逆滤波过程示意图(Hardcastle et al,1997) 278
16.2.2 共鸣的声学特性 279
16.2.3 声源特性 279
16.2.4 LF模型 279
图16.3 LF-模型基本定义的示意图(Fant et al,1985) 280
16.3 发声的语音学理论框架 281
16.3.2 调声发声 282
16.3.1 调时发声 282
16.4 调音的语音学框架 282
16.4.1 共鸣调音(元音) 283
16.4.3 音长调音(时长) 283
16.4.2 阻碍调音(辅音) 283
16.5 基于言语声学的语音学理论框架 284
16.5.1 调音音质 284
16.5.3 元音音质类型 285
表16.1 音质类型及在语音学、言语声学和言语生理学中的对应关系 285
16.5.2 发声音质 285
16.5.4 嗓音声学发声图 286
图16.4 嗓音声学图,横坐标为开商,纵坐标为速度商 286
图16.5 汉语男女声持续元音发声图,横坐标为速度商,纵坐标为基频 287
16.5.5 声调的定义与范畴 288
16.5.7 调质的定义 289
16.5.8 声调的定义 289
16.5.6 调形的定义 289
16.6 发声的语音学研究 290
第十七章 语言发声的相关研究 292
图17.2 彝语男女各五十人开商的平均值 293
图17.3 蒙古语男女各五十人开商的平均值 293
图17.1 藏语男女各五十人开商的平均值 293
17.2 声门阻抗信号与声带振动 294
17.1 嗓音参数在不同语言中的分布 294
17.2.1 正常嗓音 294
17.2.2 高音调嗓音 295
图17.4 正常嗓音参数示意图 295
图17.5 高音调嗓音参数示意图 296
17.2.3 低音调嗓音 296
图17.6 气泡音参数示意图 297
17.3 信号类型与基频研究 297
17.3.1 声门面积脉冲类型和基频 297
17.3.2 基频与信号类型 298
图17.8 双脉冲声门波,横轴为帧,纵轴为数值(像素) 298
图17.7 单脉冲声门波,横轴为帧,纵轴为数值(像素) 298
图17.10 双脉冲和三脉冲声门波示意图 299
图17.9 单脉冲声门波不同信号示意图 299
17.4 基于高速数字成像的动态声门模型 300
17.4.1 嗓音生理模型 300
17.3.3 基频的信号处理 300
图17.12 基本函数2 301
图17.11 基本函数1 301
图17.13 基本函数和4个控制函数的生成过程 302
17.4.2 嗓音合成 302
图17.15 具有低通特性的合成嗓音 303
图17.14 典型嗓音的合成(声门面积函数、其微分形式和频谱特性) 303
17.4.3 语音合成 304
图17.16 男声典型嗓音合成 304
图17.17 原始嗓音(上)和合成嗓音(下) 305
图17.18 原始语音波形(上)和合成语音波形(下) 305
图17.20 原始嗓音(上)和合成嗓音(下) 306
图17.19 女声典型嗓音合成 306
图17.21 原始语音波形(上)和合成语音波形(下) 307
图17.22 气泡音的合成 307
图17.23 原始嗓音(上)和合成嗓音(下) 308
图17.24 原始语音波形(上)和合成语音波形(下) 308
17.5 高速数字成像研究病变嗓音 308
图17.25 24帧声带振动的图像 309
17.5.1 病变嗓音声带的基本振动情况 309
图17.26 12个动态声门参数示意图 310
图17.27 声门面积函数、喉头仪信号、语音信号及两种形式的声源信号 310
17.5.2 声带不对称振动的计算 311
17.6 基于小波变换的嗓音研究 311
17.6.1 基频提取 312
图17.28 小波分析及合成示意图 312
17.6.2 改变频率域特征 313
图17.29 基于小波分析的基频提取示意图 313
图17.31 在小波域增强了第一谐波振幅和降低了高次谐波振幅后的[a]的频谱 314
图17.32 在小波域降低了第一谐波振幅和增强了高次谐波振幅后的[a]的频谱 314
图17.30 正常嗓音[a]的频谱 314
17.7.1 基本发声类型 315
17.7 发声类型及变换 315
17.6.3 改变时域特征 315
图17.33 (a)经过逆滤波和低通处理后的一个耳语嗓音波形;(b)耳语嗓音的功率谱 317
图17.34 (a)经过逆滤波和低通处理后的另一个耳语嗓音波形;(b)功率谱 317
17.7.2 男女嗓音的差异 318
图17.35 (a)人造喉的语音波形;(b)语图;(c)频谱 319
17.7.3 人造喉嗓音的特征 319
17.7.4 耳语转换正常嗓音 320
图17.36 正常嗓音[sa]的语图 321
图17.37 正常嗓音[sa]中元音的一段语音波形 321
图17.38 正常嗓音[sa]中元音一个断面的频谱 321
图17.40 耳语嗓音[sa]中元音的一段语音波形 322
图17.41 耳语嗓音[sa]中元音一个断面的功率谱 322
图17.39 耳语嗓音[sa]的语图 322
图17.43 由耳语变换的正常嗓音[sa]中元音的一段语音波形 323
图17.44 由耳语变换来的正常嗓音[sa]中一个断面的功率谱 323
图17.42 由耳语变换的正常嗓音[sa]的语图 323
17.8.2 波形拼接方式 324
17.8 语音合成与声源 324
17.8.1 共振峰合成方式 324
17.9 其它 325
参考文献 326