第1章 介绍 1
1.1 中文自然语言处理是什么 1
1.2 关于本书 5
第2章 中文的词 6
2.1 引言 6
2.2 字、语素与词 6
2.3 词的构成 9
2.4 词的识别及分词 20
2.5 小结 20
第3章 中文的语素 21
3.1 引言 21
3.2 中文的特点 21
3.3 书写习惯 26
3.4 语言学特征 27
3.5 小结 35
第4章 中文分词 36
4.1 简介 36
4.2 中文分词的两个主要挑战 36
4.3 算法介绍 39
4.4 分词过程中的歧义 48
4.5 评价标准 52
4.6 开放工具 54
4.7 小结 55
第5章 未登录词识别 56
5.1 简介 56
5.2 未登录词的检测及识别 58
5.3 中文人名识别 60
5.4 中文组织名识别 62
5.5 中文地名识别 65
5.6 小结 66
第6章 词义 67
6.1 基本含义、概念及联系 67
6.2 框架、搭配及动词配价 68
6.3 中文字典/词典 69
6.4 Word Nets 72
6.5 小结 86
第7章 中文搭配 88
7.1 搭配的概念 88
7.2 定性性质 91
7.3 定量特征 92
7.4 搭配的分类 94
7.5 语言学资源 96
7.6 应用 99
7.7 小结 100
第8章 中文搭配自动抽取 101
8.1 介绍 101
8.2 基于窗口统计的方法 101
8.3 基于句法结构的方法 112
8.4 基于语义的方法 115
8.5 基于分类的方法 116
8.6 参考基准 118
8.7 小结 119
参考文献 120
附录 131