当前位置:首页 > 语言文字
机器翻译研究
机器翻译研究

机器翻译研究PDF电子书下载

语言文字

  • 电子书积分:22 积分如何计算积分?
  • 作 者:冯志伟著
  • 出 版 社:北京:中国对外翻译出版公司
  • 出版年份:2004
  • ISBN:7500112742
  • 页数:841 页
图书介绍:“十五”国家重点图书:本书系统介绍机器翻译的历史和现状、各种类型的机器翻译系统、机器翻译的实现过程,着重介绍机器翻译的方法等。
《机器翻译研究》目录

目录 1

丛书总序 1

第一章 机器翻译概述 1

1.1 什么是机器翻译 1

本卷主编寄语 5

1.2 对于机器翻译的一些误解 5

前言 9

1.3 机器翻译发展的曲折道路 12

第二章 各种类型的机器翻译系统 35

2.1 基于规则的机器翻译系统 35

2.1.1 国外的系统 35

2.1.2 国内的系统 38

2.1.3 基于规则的机器翻译系统的类型 40

2.2.1 基于统计的机器翻译系统 44

2.2 基于语料库的机器翻译系统 44

2.2.2 基于实例的机器翻译系统 50

2.3 多引擎机器翻译系统 52

2.4 口语机器翻译系统 56

2.4.1 AT T公司的语音机器翻译系统 56

2.4.2 Verbmobil系统 57

2.4.3 其他的口语机器翻译系统 60

2.5 因特网与机器翻译 61

2.6 机器翻译与翻译记忆 64

第三章 机器翻译的实现过程 67

3.1 机器翻译结果比较 67

3.2 机器翻译金字塔 74

3.3 基于转换的机器翻译的实现过程 76

3.3.1 特征和特征值的定义 76

3.3.2 词典编写 80

3.3.3 形态分析 81

3.3.4 句法分析 85

3.3.5 逻辑语义分析 89

3.3.6 双语转换 91

3.3.7 目标语言生成 93

3.3.8 基于转换的英汉机器翻译实例 94

3.4 直接翻译系统的实现过程 99

第四章 形态自动分析 103

4.1 有限状态转移网络 103

4.1.1 有限状态转移网络的基本原理 103

4.1.2 有限状态转换机 113

4.1.3 有限状态机器的局限性 116

4.2 不同类型语言的形态自动分析 119

4.2.1 不同类型语言形态分析的特点 119

4.2.2 形态自动分析规则的编制方法 123

4.2.3 形态分析的理论依据 128

4.3 词的形式化描述与分析 130

4.3.1 词和词形式 130

4.3.2 语素和语素变体 135

4.3.3 词形式的形态分析步骤 137

4.3.4 词形式的自动识别方法 137

4.3.5 语素变体规则(Allo-rules) 141

4.3.6 组合规则(Combi-rules) 146

4.3.7 毗连模式(Concatenation patterns)示例 147

4.4 词类标记集和词类标注 149

4.4.1 英语中使用的主要的词类标记集 149

4.4.2 词类标注 152

4.5 英语分析中的兼类词消歧策略 155

4.5.1 英语中词的兼类现象 157

4.5.2 英语中兼类词的消歧策略 166

4.5.3 E-to-J机器翻译系统的同形兼类词的消歧规则概览 167

第五章 基于转移网络的自动句法分析 181

5.1 递归转移网络………………………………………18l5.1.1 自然语言的递归特性…………………………18l5.1.2 从有限状态网络(FSTN)到递归转移网络(RTN) 182

5.1.3 用递归转移网络(RTN)进行句子识别 186

5.1.4 用递归转移网络(RTN)进行随机生成 199

5.1.5 下推转录机 200

5.2 扩充转移网络 202

5.2.1 RTN的局限性 202

5.2.2 扩充转移网络在机器翻译中的应用 203

第六章 基于上下文无关语法的自动句法分析 208

6.1 短语结构语法 208

6.1.1 短语结构语法的代数定义 210

6.1.2 形式语法的乔姆斯基分类 211

6.1.3 形式语法的生成能力 212

6.2 英语的上下文无关语法 219

6.2.1 上下文无关规则和树形图 219

6.2.2 英语的句子结构 222

6.2.3 英语的名词短语 224

6.2.4 联合结构 225

6.2.5 一致关系 226

6.2.6 英语的动词短语和动词的再分类 227

6.2.7 助动词 229

6.2.8 语法的等价与乔姆斯基范式 230

6.2.9 有限状态语法与上下文无关语法的关系 231

6.3 自底向上剖析 234

6.3.1 剖析的定义 234

6.3.2 剖析就是搜索 235

6.3.3 自底向上剖析的过程 236

6.4 自顶向下剖析 240

6.4.1 自顶向下剖析的过程 240

6.5 左角分析法 244

6.5.1 左角的概念 244

6.4.2 自顶向下剖析与自底向上剖析的比较 244

6.5.2 自底向上过滤(Bottom-up filtering) 246

6.6 自顶向下剖析的问题 250

6.6.1 左递归(Left-recursion) 250

6.6.2 结构歧义(Structure ambiguity) 251

6.6.3 子树无效的重复分析 (Inefficient re-parsing of sub-tree) 265

6.7 Earley算法 268

6.7.1 线图和点规则(Chart and dotted rule) 269

6.7.2 Earley算法的三种操作 270

6.7 3 Earley算法示例 272

6.7.4 从线图中检索剖析树 275

6.8 花园幽径句的自动分析 287

6.8.1 英语中的花园幽径句 287

6.8.2 汉语中的花园幽径句 290

6.8.3 花园幽径度 297

6.8.4 花园幽径句的三个特性 299

6.8.5 花园幽径句的自动分析算法 303

6.8.6 准花园幽径句 313

6.8.7 语义花园幽径句 314

6.9 CYK算法 316

6.10 富田算法 324

6.11 浅层句法分析 329

6.11.1 基于有限状态自动机的浅层分析 330

6.11.2 基于隐马尔可夫模型的浅层句法分析 337

6.11.3 基于中心词依存概率的浅层句法分析 338

6.11.4 模仿词性标注的浅层句法分析 339

第七章 基于特征结构的自动句法分析 343

7.1 多值标记函数与复杂特征 343

7.2 特征结构与合一运算 357

7.2.1 “属性—值”矩阵 357

7.2.2 特征路径和重入结构 360

7.2.3 特征结构的合一 362

7.2.4 “包孕于”关系 370

7.2.5 “合一”的形式定义 371

7.3 特征结构与语法 373

7.3.1 使用特征结构来增强上下文无关语法的规则 373

7.3.2 一致关系 374

7.3.3 中心语特征 376

7.3.4 次范畴化 378

7.3.4.1 原子特征SUBCAT的描述方法 378

7.3.4.2 次范畴化框架 380

7.3.5 长距离依存关系 382

7.4 合一运算的实现 384

7.4.1 合一的数据结构 384

7.4.2 合一运算的操作过程 384

7.4.3 合一运算实现的其他示例 388

7.4.4 带合一约束的自动句法分析 402

7.5 类型与继承关系 406

7.5.1 简单类型 407

7.5.2 复杂类型 408

第八章 基于依存语法的自动句法分析 412

8.1 从依存语法到配价语法 412

8.2 依存语法与短语结构语法的等价性 419

8.3 依存语法与从属树的一些形式特性 429

8.4 依存语法在机器翻译系统中的应用 434

第九章 基于概率的自动句法分析 444

9.1 上下文无关语法与句子的歧义 444

9.2 概率上下文无关语法 448

9.3 概率CYK算法 453

9.4 规则和概率的获取 454

9.5 概率上下文无关语法的无关性假设 457

9.6.1 结构依存问题 459

9.6 结构依存和词汇依存的问题 459

9.6.2 词汇依存问题 460

9.7 概率词汇化上下文无关语法 463

第十章 语义自动分析 467

10.1 意义的形式化表示方法 467

10.1.1 语言意义的四种表示方法 468

10.1.2 谓词论元结构(Predicate-argument structure) 469

10.2 一阶谓词演算 472

10.2.1 FOPC的基本句法 472

10.2.2 FOPC的语义 475

10.2.3 变量和量词 477

10.2.4 FOPC中的推理 479

10.2.5 某些与语言学相关的概念 482

10.3 意义的其他表示方法 492

10.3.1 语义网络 492

10.3.2 概念依存图 494

10.3.3 框架表示法 501

10.4 语义分析 502

10.4.1 句法驱动的语义分析 502

10.4.2 语义语法 515

10.5 词汇语义学与知识本体 520

10.5.1 词汇语义学 520

10.5.2 知识本体 526

10.6 词网 535

10.6.1 词网的3个基本假设和规模 536

10.6.2 词网中的名词 537

10.6.3 词网中的形容词 544

10.6.4 词网中的副词 549

10.6.5 词网中的动词 549

10.7 结构语义学 552

10.7.1 题元角色关系 553

10.7.2 选择限制 557

10.8 框架网络 560

第十一章 词义排歧方法 566

11.1 英语中的词汇歧义现象 566

11.1.1 名词中的歧义 566

11.1.2 代词中的歧义 568

11.1.3 动词中的歧义 569

11.1.4 形容词中的歧义 570

11.1.5 连接词中的歧义 571

11.1.6 介词中的歧义 571

11.2 几种重要的词义排歧方法 573

11.2.1 选择最常见涵义的方法 574

11.2.2 利用词类进行词义排歧的方法 576

11.2.3 基于选择限制的词义排歧方法 578

11.2.4 自立的词义排歧方法 585

11.2.5 有指导的学习方法 588

11.2.6 自举的词义排歧方法 590

11.2.7 无指导的词义排歧方法 591

11.2.8 基于词典的词义排歧方法 593

第十二章 语用的自动分析 596

12.1 所指判定 596

12.1.1 所指的句法和语义约束 596

12.1.2 代词判定算法 608

12.2 文本连贯的自动分析 615

12.2.1 文本连贯现象 615

12.2.2 基于推理的判定算法 619

12.2.3 连贯和同指 627

12.2.4 话语结构 629

12.3 修辞结构理论 631

13.1.1 语言类型学 637

13.1 语言的相似性和差异性 637

第十三章 机器翻译中的转换 637

13.1.2 转换中语言的差异 640

13.2 从机器翻译看汉语的特点 660

13.3 词汇转换和结构转换 672

第十四章 目标语言生成 679

14.1 生成系统的体系结构 679

14.2 机器翻译中的生成 681

14.2.1 系统功能语法 682

14.2.2 功能合一语法 688

14.2.3 意义—文本理论 693

第十五章 机器翻译的词典 702

15.1 分析词典中语言信息的描述方法 702

15.1.1 宏表示法 703

15.1.2 词形条款 719

15.2 词典查询结果的排歧 721

15.2.1 德语冠词的功能歧义 722

15.2.2 基于集合运算的德语冠词功能排歧 726

15.3 转换词典 728

15.3.1 转换词典条目的结构 728

15.3.2 词汇转换程序的结构 731

15.4 生成词典 740

15.4.1 形态生成程序的外部数据 740

15.4.2 生成词典类型和结构 742

第十六章 因特网上的翻译工具 750

16.1 因特网上的机器翻译系统和机器翻译软件 750

16.2 因特网上的翻译记忆系统 766

16.3 因特网上的词典和词表 768

16.4 因特网上的其他翻译工具 770

附录 关于机器翻译和计算语言学的对话(冯志伟教授口述访谈记录) 773

参考文献 830

返回顶部