当前位置:首页 > 工业技术
汉语人机语音通信基础  科学前沿进展
汉语人机语音通信基础  科学前沿进展

汉语人机语音通信基础 科学前沿进展PDF电子书下载

工业技术

  • 电子书积分:21 积分如何计算积分?
  • 作 者:张家騄著
  • 出 版 社:上海:上海科学技术出版社
  • 出版年份:2010
  • ISBN:9787532397105
  • 页数:787 页
图书介绍:本书介绍了语音通讯发展的历史,语音信息处理的声学、语音学和心理学的基本理论,以应对语音信息处理和人机语言通讯的多学科交叉特点。进而详细讨论言语分析、言语感知和语音质量评价内容。
《汉语人机语音通信基础 科学前沿进展》目录

第0章 绪论 1

0.1 初创时期 2

0.2 机械模拟时期 3

0.3 波形原理时期 5

0.4 参数提取时期 7

0.5 信息处理时期 12

参考文献 15

第1章 电学基础 16

1.1 电学的发展 17

1.2 电的物理性质 18

1.3 电路基本元件 22

1.3.1 电阻 22

1.3.2 电感 24

1.3.3 变压器 26

1.3.4 电容 28

1.4 电路分析的数学工具 31

1.4.1 三角函数 31

1.4.2 双曲函数 35

1.4.3 复数 39

1.5 电路分析 46

1.5.1 电源 46

1.5.2 基本定律和定理 46

1.6 交流电路 51

1.6.1 正弦波 51

1.6.2 交流阻抗 56

1.6.3 串联共振 60

1.6.4 并联共振 62

1.6.5 暂态过程 64

1.7 传输线 67

1.7.1 均匀长线 67

1.7.2 特性阻抗 70

1.7.3 传播常数 71

1.7.4 波长和传播速度 72

1.8 傅里叶分析 73

1.8.1 傅里叶级数 73

1.8.2 傅里叶变换 77

1.8.3 不确定原理 78

1.9 转移函数 79

1.9.1 拉普拉斯变换 79

1.9.2 转移函数 80

1.9.3 电路元件的频域表示 81

1.9.4 常用拉普拉斯变换简表 82

1.9.5 转移函数示例 82

1.10 调制 85

1.10.1 振幅调制 86

1.10.2 频率调制 87

1.11 数字表示 89

1.11.1 采样 89

1.11.2 量化 91

1.11.3 采样定理 93

1.11.4 Z变换 96

1.12 信息论初阶 98

1.12.1 信息的度量 99

1.12.2 汉语拼音字母和汉语语音的信息量 100

1.12.3 多余度 107

1.12.4 信道容量 108

1.12.5 二部系统 109

参考文献 110

第2章 语音学基础 112

2.1 语音学的发展 112

2.2 什么是语音 113

2.3 语音的属性 114

2.3.1 语音的自然属性 114

2.3.2 语音的社会属性 119

2.4 语音的分类 120

2.4.1 元音的分类 121

2.4.2 辅音的分类 122

2.5 语音的结合 124

2.5.1 音节 124

2.5.2 复合元音 124

2.5.3 复合辅音 124

2.5.4 过渡音 125

2.5.5 汉语普通话的音节结构 125

2.6 语音的变化 126

2.6.1 同化 126

2.6.2 异化 127

2.6.3 增音和减音 128

2.7 音位和音位学 128

2.8 汉语音位系统和区别特征系统 129

2.8.1 问题的提出 129

2.8.2 汉语普通话音位系统 132

2.8.3 区别特征的定义 135

2.8.4 汉语普通话区别特征系统 140

2.8.5 普通话儿化韵 144

2.9 汉语普通话机读音标SAMPA-SC 145

2.10 韵律结构 154

2.10.1 音节 154

2.10.2 音步 155

2.10.3 韵律词 155

2.10.4 音韵短语 155

2.10.5 语调短语 156

2.11 语调和语调模型 157

2.11.1 语调 157

2.11.2 语调模型 158

参考文献 169

第3章 声学基础 170

3.1 声学的发展 170

3.2 声波 172

3.3 管中的声波 177

3.3.1 驻波 178

3.3.2 管口的末端校正 179

3.3.3 管与声道 179

3.4 喇叭 180

3.5 声波的性质 182

3.5.1 标准大气 182

3.5.2 声速 183

3.5.3 特性阻抗 183

3.5.4 声衰减 184

3.6 声波的客观度量 186

3.6.1 分贝与声强级、声压级 187

3.6.2 声级简化计算法 188

3.6.3 声压级举例 190

3.6.4 声强测量 191

3.7 声波的主观度量 191

3.7.1 响度与响度级 192

3.7.2 音调、音高和临界频带 194

3.8 声级计 198

3.9 用带通滤波器作精密频率分析——邻带差值法 199

3.10 动力类比 202

3.10.1 四种一维系统 202

3.10.2 声阻 204

3.10.3 声质量 205

3.10.4 声顺 206

3.10.5 声导 207

3.11 听觉 208

3.11.1 人耳的构造和功能 209

3.11.2 听觉学说 212

3.11.3 听阈 214

3.11.4 听力损失 215

3.11.5 正常听力的听觉范围 215

3.11.6 差阈 216

3.11.7 双耳功能 218

3.12 环境声学 219

3.12.1 房间声学 219

3.12.2 室内噪声和环境噪声 221

3.13 电声学 222

3.13.1 传声器 222

3.13.2 扬声器 226

3.13.3 耳机 229

参考文献 230

第4章 语音产生的声学特性 231

4.1 人类发音系统 231

4.1.1 呼吸系统 232

4.1.2 声源器官 233

4.1.3 调音器官 234

4.2 发音器官的等效声学元件 234

4.3 言语声波辐射 235

4.4 嗓音声源 237

4.4.1 声门阻抗 238

4.4.2 嗓音声源与声道的相互作用 240

4.4.3 声门脉冲的右倾 241

4.4.4 纹波效应 244

4.4.5 叠加效应 245

4.4.6 瞬时共振频率和带宽 246

4.4.7 共振峰振幅与共振峰频率、基音频率之间的关系 247

4.4.8 浊辅音的嗓音声源 249

4.5 嗓音工作方式 249

4.5.1 气声 250

4.5.2 挤音 251

4.5.3 耳语 251

4.6 非相互作用嗓音声源模型 251

4.7 模型的细化——剩余闭合段问题 257

4.8 相互作用嗓音声源模型 259

4.9 噪声声源 261

4.10 声道的声学特性 264

4.11 语音频谱构成分析 268

4.11.1 声道转移函数 268

4.11.2 共振峰模式 269

4.11.3 浊音频谱 270

4.11.4 双管模型 273

4.11.5 喇叭-三参数模型 276

4.11.6 侧壁阻抗的影响 279

4.11.7 声辐射阻抗的影响 280

4.11.8 声门阻抗的影响 280

4.11.9 辅音激励的影响 281

4.11.10 鼻腔的影响 281

4.11.11 流音 286

4.12 辅音的频谱构成分析 289

4.12.1 辅音产生的简化模型 290

4.12.2 不送气清塞音 291

4.12.3 擦音 299

4.12.4 塞擦音 304

4.12.5 送气辅音 305

4.13 口腔内的声场分布 309

参考文献 314

第5章 语音分析 316

5.1 物理分析 317

5.1.1 声学环境分析 317

5.1.2 言语声级测量 319

5.1.3 语音检测 321

5.1.4 时间结构分析 323

5.2 频谱分析理论和实践 326

5.2.1 频谱分析的理论基础 326

5.2.2 声图仪 328

5.2.3 快速傅里叶变换 331

5.2.4 长时言语平均频谱 334

5.2.5 频谱分析实践 335

5.3 倒频谱分析 338

5.3.1 倒频谱的基本概念 338

5.3.2 美频率倒频谱分析 340

5.3.3 同态映射 342

5.3.4 倒谱分析的应用 343

5.4 线性预测分析 343

5.4.1 线性预测分析的基本原理 344

5.4.2 线性预测编码系统的扩展 347

5.4.3 感知线性预测分析 347

5.5 小波变换 349

5.5.1 基本概念 349

5.5.2 连续小波变换 352

5.5.3 离散小波变换 355

5.6 语音统计分析 356

5.6.1 齐夫定律 357

5.6.2 语言统计示例 358

参考文献 361

第6章 汉语语音分析 362

6.1 元音分析 362

6.1.1 元音的波形和频谱 363

6.1.2 元音的共振峰频率 367

6.1.3 汉语元音的声学元音图 367

6.1.4 准动态元音分析——重叠频谱 369

6.2 辅音分析 372

6.3 语音的动态频谱 379

6.3.1 试验方法 380

6.3.2 试验结果 380

6.4 声调分析 385

6.4.1 不同发音方式对F0的分布和声带工作的影响 386

6.5 元音内在音高 392

6.5.1 内在音高机制 393

6.5.2 汉语内在音高 395

6.5.3 汉语、英语和德语的内在音高对比 404

6.6 汉语和外语的基频模式对比 407

6.6.1 基频分布的宏观统计 408

6.6.2 基频分布的微观统计 409

6.7 汉语长时平均频谱 412

6.8 汉语韵律特征分析 418

6.8.1 试验材料和试验方法 418

6.8.2 声调和语调的关系 419

6.8.3 语调的时间特征 420

6.8.4 声调模式与句型 421

6.8.5 语调的稳定特征和个人特征 427

6.8.6 语调格子 427

6.8.7 语句的时间结构 428

6.8.8 韵律特征之间的相互作用 434

6.9 汉语统计特性 439

6.9.1 汉字的发展 440

6.9.2 声母、韵母的出现频率 441

6.9.3 声母和韵母的结合概率 445

6.9.4 汉语单词出现频率 449

6.9.5 单词分布规律 452

6.9.6 单词出现频率和单词出现位次之间的关系——齐夫定律 453

6.10 汉语语音资料库 457

6.11 汉语语音听力香蕉图 458

参考文献 460

第7章 言语可懂度与语音质量评定 462

7.1 史的叙述 463

7.2 名词和术语 467

7.3 汉语清晰度测试 468

7.3.1 清晰度测试音节表KXY 468

7.3.2 清晰度测试词表KXC 472

7.3.3 清晰度测试句表 477

7.3.4 清晰度测试表的语音分布 477

7.4 音节清晰度与传递条件的关系 482

7.4.1 音节清晰度与接收言语声压级的关系 482

7.4.2 音节清晰度与信噪比的关系 483

7.4.3 音节清晰度与频带宽度的关系 486

7.4.4 在不同的通过频带下信噪比与音节清晰度的关系 487

7.4.5 混响时间和言语可懂度的关系 489

7.5 清晰度指数 490

7.5.1 清晰度指数的理论基础 491

7.5.2 导出汉语清晰度指数的方法 492

7.5.3  清晰度指数与频率的关系 497

7.6 可懂度理论 499

7.6.1 音节清晰度与清晰度指数之间的关系 499

7.6.2 音节清晰度和语音清晰度之间统计关系:独立概率模型 501

7.6.3 音节清晰度和语音清晰度之间统计关系:条件概率模型 504

7.6.4 单词可懂度和音节清晰度之间的统计关系 508

7.6.5 单句可懂度和音节清晰度之间的关系 517

7.7 声调在言语可懂度中的作用 518

7.8 简化清晰度测试方法 520

7.8.1 改进的押韵测试 520

7.8.2 诊断押韵测试 529

7.8.3 其他方法 529

7.9 言语可懂度的客观评测 530

7.9.1 言语可懂度指数 530

7.9.2 言语传递指数 535

7.10 语音通信质量主观评价 544

7.10.1 言语自然度 545

7.10.2 整体质量评价 545

7.11 语音通信质量客观评测 548

7.11.1 语音通信质量客观评测的基本原理 548

7.11.2 语音通信质量客观评测的标准方法 549

7.12 言语知觉 552

7.12.1 听觉线索模型 553

7.12.2 动觉理论 555

7.12.3 寻踪模型 558

7.13 汉语语音知觉特征分析 560

7.13.1 多维分析 560

7.13.2 聚类分析 565

7.13.3 信息通道分析 568

参考文献 574

第8章 言语输出 577

8.1 语音合成的历史发展 578

8.1.1 机械语音合成器 578

8.1.2 电子语音合成器 581

8.2 语音参数合成 583

8.2.1 发音器官参数合成 583

8.2.2 共振峰参数合成 584

8.3 波形拼接合成 590

8.4 单元选择语音合成 591

8.4.1 单元选择 592

8.4.2 单元匹配 595

8.4.3 匹配度量 597

8.4.4 单元拼接 599

8.5 数据驱动共振峰语音合成 601

8.6 文语转换系统 603

8.6.1 汉语文语转换系统 607

8.7 概念生成言语系统 609

参考文献 612

第9章 言语输入 614

9.1 语音识别 614

9.1.1 语音识别的历史发展 614

9.1.2 最早的汉语语音识别系统 620

9.1.3 语音识别系统概述 621

9.1.4 语音信号表示 624

9.1.5 隐马尔可夫模型 627

9.1.6 隐马尔可夫模型用于语音识别 630

9.1.7 隐马尔可夫模型的局限 636

9.1.8 人工神经网络模型 636

9.1.9 语音识别系统的性能指标 637

9.2 说话人识别 640

9.2.1 说话人识别技术的发展 641

9.2.2 说话人识别与其他生物度量技术的比较 644

9.2.3 说话人确认 645

9.2.4 自动说话人识别系统性能评测 649

9.3 自动语种辨认 652

9.3.1 语种辨认的发展 652

9.3.2 自动语种辨认系统 654

9.3.3 言语资料库 659

参考文献 660

第10章 口语对话系统 662

10.1 口语对话系统 663

10.1.1 基本概念 665

10.1.2 口语对话系统的架构 666

10.2 口语对话系统模拟 667

10.3 口语对话系统性能评测 670

10.3.1 PARADISE口语对话性能评测方法 671

10.3.2 口语对话系统的可用性评测 678

10.4 言语翻译系统 685

10.5 计算机辅助语言学习和发音质量评测 687

10.5.1 基本体系结构 688

10.5.2 人工发音质量评测 689

10.5.3 自动发音质量评测 691

10.5.4 计算机辅助语言学习实践 696

10.5.5 汉语自动发音质量评测 698

参考文献 700

索引 702

名词索引(中英对照) 702

名词索引(英中对照) 735

人名索引(中英对照) 767

人名索引(英中对照) 776

后记 785

相关图书
作者其它书籍
返回顶部