第一章 计算语言学简介 1
第一节 计算语言学是一门边缘科学 1
第二节 计算语言学研究的基本问题 3
第三节 计算语言学研究的基本方法 4
一、理性主义和经验主义:计算语言学研究方法的哲学分野 4
二、计算语言学研究方法 5
第四节 计算语言学的应用 8
第二章 预备知识 10
第一节 离散数学基础 10
一、集合及相关的概念 10
二、图及相关的概念 11
三、字符串及相关的概念 12
四、栈及相关的概念 15
五、序及相关的概念 15
第二节 概率统计理论基础 17
第三节 信息论基础 26
第三章 形式语言及自动机 34
第一节 形式语言和自动机的直观意义 34
第二节 形式语言和自动机的定义 35
一、形式语言的定义 35
二、自动机的定义 39
第四章 语法理论和表示形式 46
第一节 GB理论 46
第二节 词汇功能语法 49
第三节 广义词组结构语法 51
第四节 树连接语法 53
第五节 链语法 55
第五章 语言的识别与分析 57
第一节 有限状态语法的识别和分析算法 58
第二节 上下文无关语法的识别和分析算法 58
一、移进—归约法 58
二、由底向上的图表法 64
三、欧雷算法 69
四、GLR算法 70
五、链语法的识别算法 82
一、基于原则的分析方法 85
第三节 其他类型的分析器 85
二、基于归一的分析方法 87
第六章 计算语义方面的一些工作 91
第一节 语义理论简介 91
一、词的指称作为意义 91
二、心理图象,大脑图象或思想作为意义 92
三、说话者的意图作为意义 92
四、过程语义 93
五、词汇分解学派 93
六、条件真理模型 94
七、情景语义学 94
九、模态逻辑 95
八、语义网络 95
第二节 计算语义学的一些代表工作 96
一、概念依赖理论 96
二、选择限制学说 99
三、指代化解 101
四、计算语义学的一些其他方面 103
第七章 容错分析 106
第一节 基于关键词或中心词的方法 106
第二节 省略不识词的方法 107
第三节 元规则方法 108
第四节 同化法 109
第一节 Ngram 116
第八章 概率语法 116
一、减值法(Discounting) 118
二、删除插值法(Deleted Interpolation) 121
三、基于词分类的Ngram 122
第二节 隐马尔柯夫模型 122
一、马尔柯夫模型 122
二、隐马尔柯夫模型 124
三、向前算法 126
四、韦特比算法 130
五、向前向后算法 132
第三节 概率上下文无关文法 136
一、向内算法 137
二、韦特比算法 139
三、向内向外算法 140
第九章 语言学习 145
第一节 词分类 145
第二节 词法学习 148
一、语法框架 148
二、词汇选择(Lexical Selection) 152
第三节 语法学习 155
一、有限状态自动机的机器学习 155
二、语法推导的理论问题 159
三、贝叶斯推理在语法推导中的应用 161
第十章 当前计算语言学的研究 166
第一节 统计学机器翻译 166
一、IBM统计学机器翻译 167
二、参数训练 168
三、源语言搜索 169
第二节 词类标识(Part-of-Speech Tagging) 170
一、隐马尔柯夫模型词类标识 171
二、基于规则的词类标识 172
第三节 歧义化解(Disambiguation) 174
一、基于结构的语法歧义化解 175
二、统计学语法歧义化解 177
三、词汇歧义化解(Lexical Disambiguation) 180
附录A 汉英术语对照 185
附录B 有关计算语言学的重要期刊和会议 194
附录C 参考文献 196