目录 1
丛书总序 1
第一章 机器翻译概述 1
1.1 什么是机器翻译 1
本卷主编寄语 5
1.2 对于机器翻译的一些误解 5
前言 9
1.3 机器翻译发展的曲折道路 12
第二章 各种类型的机器翻译系统 35
2.1 基于规则的机器翻译系统 35
2.1.1 国外的系统 35
2.1.2 国内的系统 38
2.1.3 基于规则的机器翻译系统的类型 40
2.2.1 基于统计的机器翻译系统 44
2.2 基于语料库的机器翻译系统 44
2.2.2 基于实例的机器翻译系统 50
2.3 多引擎机器翻译系统 52
2.4 口语机器翻译系统 56
2.4.1 AT T公司的语音机器翻译系统 56
2.4.2 Verbmobil系统 57
2.4.3 其他的口语机器翻译系统 60
2.5 因特网与机器翻译 61
2.6 机器翻译与翻译记忆 64
第三章 机器翻译的实现过程 67
3.1 机器翻译结果比较 67
3.2 机器翻译金字塔 74
3.3 基于转换的机器翻译的实现过程 76
3.3.1 特征和特征值的定义 76
3.3.2 词典编写 80
3.3.3 形态分析 81
3.3.4 句法分析 85
3.3.5 逻辑语义分析 89
3.3.6 双语转换 91
3.3.7 目标语言生成 93
3.3.8 基于转换的英汉机器翻译实例 94
3.4 直接翻译系统的实现过程 99
第四章 形态自动分析 103
4.1 有限状态转移网络 103
4.1.1 有限状态转移网络的基本原理 103
4.1.2 有限状态转换机 113
4.1.3 有限状态机器的局限性 116
4.2 不同类型语言的形态自动分析 119
4.2.1 不同类型语言形态分析的特点 119
4.2.2 形态自动分析规则的编制方法 123
4.2.3 形态分析的理论依据 128
4.3 词的形式化描述与分析 130
4.3.1 词和词形式 130
4.3.2 语素和语素变体 135
4.3.3 词形式的形态分析步骤 137
4.3.4 词形式的自动识别方法 137
4.3.5 语素变体规则(Allo-rules) 141
4.3.6 组合规则(Combi-rules) 146
4.3.7 毗连模式(Concatenation patterns)示例 147
4.4 词类标记集和词类标注 149
4.4.1 英语中使用的主要的词类标记集 149
4.4.2 词类标注 152
4.5 英语分析中的兼类词消歧策略 155
4.5.1 英语中词的兼类现象 157
4.5.2 英语中兼类词的消歧策略 166
4.5.3 E-to-J机器翻译系统的同形兼类词的消歧规则概览 167
第五章 基于转移网络的自动句法分析 181
5.1 递归转移网络………………………………………18l5.1.1 自然语言的递归特性…………………………18l5.1.2 从有限状态网络(FSTN)到递归转移网络(RTN) 182
5.1.3 用递归转移网络(RTN)进行句子识别 186
5.1.4 用递归转移网络(RTN)进行随机生成 199
5.1.5 下推转录机 200
5.2 扩充转移网络 202
5.2.1 RTN的局限性 202
5.2.2 扩充转移网络在机器翻译中的应用 203
第六章 基于上下文无关语法的自动句法分析 208
6.1 短语结构语法 208
6.1.1 短语结构语法的代数定义 210
6.1.2 形式语法的乔姆斯基分类 211
6.1.3 形式语法的生成能力 212
6.2 英语的上下文无关语法 219
6.2.1 上下文无关规则和树形图 219
6.2.2 英语的句子结构 222
6.2.3 英语的名词短语 224
6.2.4 联合结构 225
6.2.5 一致关系 226
6.2.6 英语的动词短语和动词的再分类 227
6.2.7 助动词 229
6.2.8 语法的等价与乔姆斯基范式 230
6.2.9 有限状态语法与上下文无关语法的关系 231
6.3 自底向上剖析 234
6.3.1 剖析的定义 234
6.3.2 剖析就是搜索 235
6.3.3 自底向上剖析的过程 236
6.4 自顶向下剖析 240
6.4.1 自顶向下剖析的过程 240
6.5 左角分析法 244
6.5.1 左角的概念 244
6.4.2 自顶向下剖析与自底向上剖析的比较 244
6.5.2 自底向上过滤(Bottom-up filtering) 246
6.6 自顶向下剖析的问题 250
6.6.1 左递归(Left-recursion) 250
6.6.2 结构歧义(Structure ambiguity) 251
6.6.3 子树无效的重复分析 (Inefficient re-parsing of sub-tree) 265
6.7 Earley算法 268
6.7.1 线图和点规则(Chart and dotted rule) 269
6.7.2 Earley算法的三种操作 270
6.7 3 Earley算法示例 272
6.7.4 从线图中检索剖析树 275
6.8 花园幽径句的自动分析 287
6.8.1 英语中的花园幽径句 287
6.8.2 汉语中的花园幽径句 290
6.8.3 花园幽径度 297
6.8.4 花园幽径句的三个特性 299
6.8.5 花园幽径句的自动分析算法 303
6.8.6 准花园幽径句 313
6.8.7 语义花园幽径句 314
6.9 CYK算法 316
6.10 富田算法 324
6.11 浅层句法分析 329
6.11.1 基于有限状态自动机的浅层分析 330
6.11.2 基于隐马尔可夫模型的浅层句法分析 337
6.11.3 基于中心词依存概率的浅层句法分析 338
6.11.4 模仿词性标注的浅层句法分析 339
第七章 基于特征结构的自动句法分析 343
7.1 多值标记函数与复杂特征 343
7.2 特征结构与合一运算 357
7.2.1 “属性—值”矩阵 357
7.2.2 特征路径和重入结构 360
7.2.3 特征结构的合一 362
7.2.4 “包孕于”关系 370
7.2.5 “合一”的形式定义 371
7.3 特征结构与语法 373
7.3.1 使用特征结构来增强上下文无关语法的规则 373
7.3.2 一致关系 374
7.3.3 中心语特征 376
7.3.4 次范畴化 378
7.3.4.1 原子特征SUBCAT的描述方法 378
7.3.4.2 次范畴化框架 380
7.3.5 长距离依存关系 382
7.4 合一运算的实现 384
7.4.1 合一的数据结构 384
7.4.2 合一运算的操作过程 384
7.4.3 合一运算实现的其他示例 388
7.4.4 带合一约束的自动句法分析 402
7.5 类型与继承关系 406
7.5.1 简单类型 407
7.5.2 复杂类型 408
第八章 基于依存语法的自动句法分析 412
8.1 从依存语法到配价语法 412
8.2 依存语法与短语结构语法的等价性 419
8.3 依存语法与从属树的一些形式特性 429
8.4 依存语法在机器翻译系统中的应用 434
第九章 基于概率的自动句法分析 444
9.1 上下文无关语法与句子的歧义 444
9.2 概率上下文无关语法 448
9.3 概率CYK算法 453
9.4 规则和概率的获取 454
9.5 概率上下文无关语法的无关性假设 457
9.6.1 结构依存问题 459
9.6 结构依存和词汇依存的问题 459
9.6.2 词汇依存问题 460
9.7 概率词汇化上下文无关语法 463
第十章 语义自动分析 467
10.1 意义的形式化表示方法 467
10.1.1 语言意义的四种表示方法 468
10.1.2 谓词论元结构(Predicate-argument structure) 469
10.2 一阶谓词演算 472
10.2.1 FOPC的基本句法 472
10.2.2 FOPC的语义 475
10.2.3 变量和量词 477
10.2.4 FOPC中的推理 479
10.2.5 某些与语言学相关的概念 482
10.3 意义的其他表示方法 492
10.3.1 语义网络 492
10.3.2 概念依存图 494
10.3.3 框架表示法 501
10.4 语义分析 502
10.4.1 句法驱动的语义分析 502
10.4.2 语义语法 515
10.5 词汇语义学与知识本体 520
10.5.1 词汇语义学 520
10.5.2 知识本体 526
10.6 词网 535
10.6.1 词网的3个基本假设和规模 536
10.6.2 词网中的名词 537
10.6.3 词网中的形容词 544
10.6.4 词网中的副词 549
10.6.5 词网中的动词 549
10.7 结构语义学 552
10.7.1 题元角色关系 553
10.7.2 选择限制 557
10.8 框架网络 560
第十一章 词义排歧方法 566
11.1 英语中的词汇歧义现象 566
11.1.1 名词中的歧义 566
11.1.2 代词中的歧义 568
11.1.3 动词中的歧义 569
11.1.4 形容词中的歧义 570
11.1.5 连接词中的歧义 571
11.1.6 介词中的歧义 571
11.2 几种重要的词义排歧方法 573
11.2.1 选择最常见涵义的方法 574
11.2.2 利用词类进行词义排歧的方法 576
11.2.3 基于选择限制的词义排歧方法 578
11.2.4 自立的词义排歧方法 585
11.2.5 有指导的学习方法 588
11.2.6 自举的词义排歧方法 590
11.2.7 无指导的词义排歧方法 591
11.2.8 基于词典的词义排歧方法 593
第十二章 语用的自动分析 596
12.1 所指判定 596
12.1.1 所指的句法和语义约束 596
12.1.2 代词判定算法 608
12.2 文本连贯的自动分析 615
12.2.1 文本连贯现象 615
12.2.2 基于推理的判定算法 619
12.2.3 连贯和同指 627
12.2.4 话语结构 629
12.3 修辞结构理论 631
13.1.1 语言类型学 637
13.1 语言的相似性和差异性 637
第十三章 机器翻译中的转换 637
13.1.2 转换中语言的差异 640
13.2 从机器翻译看汉语的特点 660
13.3 词汇转换和结构转换 672
第十四章 目标语言生成 679
14.1 生成系统的体系结构 679
14.2 机器翻译中的生成 681
14.2.1 系统功能语法 682
14.2.2 功能合一语法 688
14.2.3 意义—文本理论 693
第十五章 机器翻译的词典 702
15.1 分析词典中语言信息的描述方法 702
15.1.1 宏表示法 703
15.1.2 词形条款 719
15.2 词典查询结果的排歧 721
15.2.1 德语冠词的功能歧义 722
15.2.2 基于集合运算的德语冠词功能排歧 726
15.3 转换词典 728
15.3.1 转换词典条目的结构 728
15.3.2 词汇转换程序的结构 731
15.4 生成词典 740
15.4.1 形态生成程序的外部数据 740
15.4.2 生成词典类型和结构 742
第十六章 因特网上的翻译工具 750
16.1 因特网上的机器翻译系统和机器翻译软件 750
16.2 因特网上的翻译记忆系统 766
16.3 因特网上的词典和词表 768
16.4 因特网上的其他翻译工具 770
附录 关于机器翻译和计算语言学的对话(冯志伟教授口述访谈记录) 773
参考文献 830