第1章 标准模型 1
1.1 两种技术 1
1.2 形态学和单词知识 3
1.3 句法和上下文无关语法 5
1.4 线图分析 10
1.5 意义和语义处理 19
1.6 练习 21
第2章 统计模型和英语的熵 24
2.1 概率论基础 24
2.2 统计模型 28
2.3 语音识别 30
2.4 熵 31
2.5 马尔可夫链 37
2.6 交叉熵 38
2.7 用交叉熵对模型进行评测 40
2.8 练习 44
第3章 隐马尔可夫模型及其两个应用 45
3.1 英语的三元语法模型 45
3.2 隐马尔可夫模型 50
3.3 词性标注 53
3.4 练习 59
第4章 隐马尔可夫模型的算法 61
4.1 寻找最可能的路径 61
4.2 HMM输出概率计算 65
4.3 HMM训练 69
4.4 练习 80
第5章 概率上下文无关语法 83
5.1 概率语法 83
5.2 PCFG和句法歧义 87
5.3 PCFG和语法归纳 89
5.4 PCFG和非语法性 91
5.5 PCFG和语言模型 92
5.6 PCFG的基本算法 94
5.7 练习 95
第6章 PCFG的数学原理 96
6.1 HMM和PCFG的关系 96
6.2 用PCFG为句子指派概率 98
6.3 PCFG训练 106
6.4 练习 109
第7章 概率语法学习 111
7.1 简单的方法为什么会失败 112
7.2 依存语法学习 114
7.3 通过括号语料库进行学习 118
7.4 部分语法的改进 121
7.5 练习 126
第8章 句法排歧 127
8.1 处理介词短语的简单方法 127
8.2 使用语义信息 133
8.3 关系从句依附问题 135
8.4 词汇/语义信息的统一应用 139
8.5 练习 143
第9章 词类和词义 145
9.1 聚类 145
9.2 根据下一个单词进行聚类 146
9.3 利用句法信息进行聚类 151
9.4 单词聚类中的问题 155
9.5 练习 157
第10章 词义及排歧 159
10.1 利用外部信息判定词义 160
10.2 不利用外部信息判定词义 163
10.3 意义和选择限制 168
10.4 讨论 172
10.5 练习 174
参考文献 175
符号表 179
英中对照术语表 181
中英对照术语表 190