当前位置:首页 > 语言文字
汉语语音合成  原理和技术
汉语语音合成  原理和技术

汉语语音合成 原理和技术PDF电子书下载

语言文字

  • 电子书积分:13 积分如何计算积分?
  • 作 者:吕士楠等著
  • 出 版 社:北京:科学出版社
  • 出版年份:2012
  • ISBN:9787030329202
  • 页数:373 页
图书介绍:本书包括基础篇和专题篇两大部分。基础篇详细介绍语音合成技术的发展历程和与语音合成关系密切的声学语音学知识,尤其是课题组围绕语音合成技术作出的各方面的研究和所填补的汉语语音学知识的空白。结合我们在开发汉语语音合成器中积累的经验,对各种合成器的工作原理和基本结构及其应用进行系统的阐述。此外,还介绍在语音合成系统中广泛运用的相关机器学习算法。专题篇结合近十年来国内外技术发展的热点和方向,总结我们的研究工作经验,对韵律分析与建模、数据驱动的语音合成方法、语音合成数据库的构件技术、文语转换系统的评估方法等进行专题讨论和评述,并对研究和发展方向提出建议和展望。
《汉语语音合成 原理和技术》目录

基 础篇 3

第1章 语音合成技术史的叙述 3

1.1机械式语音合成器 3

1.1.1 Kempelen的讲话机 3

1.1.2 Euphonia讲话机 6

1.2电子式语音合成器 7

1.2.1 VODER 7

1.2.2模式播放器 9

1.2.3共振峰合成器 11

1.3基于计算机的语音合成 13

1.3.1数字式共振峰语音合成技术 13

1.3.2波形拼接合成技术 19

1.4汉语语音合成的发展 21

1.4.1汉语合成研究的先驱 22

1.4.2国内汉语合成技术的研究 24

1.5总结 27

参考文献 28

附录 合成语音样品 30

第2章 声学语音学 32

2.1声学基础 32

2.1.1空气中的声波 32

2.1.2波动方程 35

2.1.3声音在管子中的传播 39

2.2言语交际过程 43

2.2.1语音的产生 45

2.2.2语音的感知 49

2.3语音的声学特征 52

2.3.1语音的时间维及频率维表示 52

2.3.2频谱分析 54

2.3.3语图和语音的频谱分析方法 62

2.3.4元音的频谱 66

2.3.5辅音的频谱 69

2.3.6音轨 70

2.4汉语普通话的音位系统 72

2.4.1汉语普通话的辅音系统 74

2.4.2汉语普通话的元音系统 76

2.4.3汉语传统的声韵调系统 78

2.5总结 83

参考文献 83

第3章 韵律 86

3.1语调模型 87

3.1.1“调核”理论和INTSINT语调模型 87

3.1.2 Pierrehumbert有限状态网络模型 90

3.1.3 Tilt语调模型 95

3.1.4 Fujisaki模型 98

3.1.5 PENTA模型 101

3.2汉语普通话韵律的基本单元 106

3.2.1词调 106

3.2.2短语语调 113

3.3句调和篇章韵律 119

3.3.1语篇语调 119

3.3.2朗读风格的影响 121

3.4总结 124

参考文献 125

第4章 汉语文语转换系统 128

4.1合成语音自然度的研究 128

4.1.1合成语音自然度实验 128

4.1.2音联对自然度的影响 131

4.1.3汉语语句重音的声学表现 138

4.2汉语共振峰合成系统 141

4.2.1系统框图 141

4.2.2合成单元 143

4.2.3语言学处理 144

4.2.4韵律设计 150

4.2.5声学处理 151

4.3基音同步波形叠加合成 175

4.3.1 PSOLA算法 176

4.3.2汉语的韵律——播音风格言语的声学分析 186

4.3.3 KX-PSOLA汉语文语转换系统的韵律模型 194

4.3.4高清晰度高自然度KX-PSOLA汉语文语转换系统 203

4.3.5《联想佳音》 211

4.4总结 217

参考文献 218

专 题篇 225

第5章 普通话的节律和重音的实验研究 225

5.1基于大规模语料库的韵律研究 225

5.1.1语料库的设计原则 225

5.1.2语料库的后期加工 227

5.1.3语料库的实体 232

5.2普通话的节律组织 233

5.2.1节律组织中的自由度 235

5.2.2节律组织规则 239

5.3普通话的重音标注、分类及分配 241

5.3.1重音的知觉强度标注 243

5.3.2重音强度的三级标注 245

5.3.3语义重音与节奏重音 251

5.3.4重音的分布与韵律边界 257

5.3.5总结 259

参考文献 260

第6章 基于大规模语料库的波形拼接合成 263

6.1韵律控制策略 264

6.1.1全控制策略 264

6.1.2半控制策略 264

6.1.3软控制策略 265

6.2基于韵律软控制策略的TTS系统的结构 267

6.3单元选择和波形拼接的策略和方法 268

6.3.1音节关联的上下文矢量 268

6.3.2上下文矢量的距离 270

6.4建立语音特征覆盖完备的言语数据库 271

6.4.1音库覆盖率与规模 271

6.4.2言语数据波形的采集和标注 272

6.4.3标注精度对合成自然度的影响 273

6.4.4基于上下文相关边界模型的自动切分方法 274

6.4.5音段波形的直接拼接合成 279

6.4.6小结 283

6.5木兰-汉英双语TTS系统 284

6.5.1木兰的结构 284

6.5.2统一的文本标准化模块 285

6.5.3语言检测和分发模块及单元提取模块 285

6.5.4言语数据库 285

6.5.5小结 286

6.6更多应用 286

6.6.1个性化TTS系统 286

6.6.2领域自适应TTS 290

6.6.3互联网个性化语音服务 296

6.7总结 300

参考文献 300

第7章 波形拼接合成语料库生成技术 303

7.1录音脚本的设计 303

7.1.1音段特征覆盖 303

7.1.2韵律特征覆盖 306

7.2发音人的挑选 307

7.2.1发音人性别的选择 307

7.2.2发音人年龄的限制 308

7.2.3发音人籍贯的选择 308

7.2.4 音色的要求 308

7.2.5专业水平的考查 308

7.2.6发音人的工作时间保证 308

7.2.7候选发音人人数的考虑 309

7.2.8候选人的发音评估 309

7.3音库录制 309

7.3.1录音室 310

7.3.2录音设备 310

7.3.3录音程序 312

7.4数字录音材料的处理 314

7.4.1复审 314

7.4.2标音 314

7.5总结 316

参考文献 316

第8章 语音合成系统的质量评估 318

8.1语音输出系统质量评估方法 318

8.1.1音节清晰度测试 319

8.1.2词和句的可懂度测试 322

8.1.3语句和篇单的整体性能测试 324

8.1.4评测的原则 327

8.2汉语语音合成质量评估 327

8.2.1 1994年“863”汉语语音合成系统评测 328

8.2.2 1995年汉语语音合成系统评价方法 329

8.3国家语言文字工作委员会汉语语音合成系统评测 331

8.3.1 2004年汉语语音合成系统评价方法 331

8.3.2 2004年的评测结果和分析 333

8.4 MOS和PC评估方法的比较 338

8.4.1测试文本和测试条件 339

8.4.2 MOS评估 339

8.4.3 PC测试 341

8.4.4 MOS和PC评测比较结果 343

8.5汉语合成语音评测新方法探索 343

8.6总结 345

参考文献 345

附录2004年评估测试语料 346

第9章 展望 351

9.1 STRAIGHT分析合成技术 351

9.2基于HMM的语音合成 358

9.2.1系统的框图 358

9.2.2训练集及参数提取 359

9.2.3 HMM模型化 359

9.2.4基于上下文聚类的决策树 360

9.2.5言语合成 362

9.3从概念到语音的合成 363

9.3.1 SOLE系统 364

9.3.2 SOCS系统 365

9.4多语种合成系统 367

9.5口语翻译系统 368

9.6总结 370

参考文献 370

后记 372

相关图书
作者其它书籍
返回顶部