第1章 引言 1
1.1 研究意义和背景 1
1.2 研究内容和基础 3
1.3 本书内容及结构安排 4
第2章 综合型语言知识库系统 7
2.1 国内外相关研究 7
2.2 综合型语言知识库的资源概况 9
2.2.1 语言数据资源简介 10
2.2.2 工具软件简介 17
2.3 系统集成方案 19
2.4 系统功能 21
2.4.1 语言加工模块 21
2.4.2 知识检索模块 22
2.4.3 知识挖掘模块 23
2.5 本章小结 24
第3章 词语的概率语法属性研究 26
3.1 现代汉语词汇计量研究的发展 27
3.2 构建《概率型现代汉语常用词汇知识库》 30
3.3 名词概率语法属性研究 31
3.3.1 “数名”属性 33
3.3.2 “数量名”属性 34
3.3.3 “前名”和“后名”属性 35
3.4 本章小结 35
第4章 数名结构的计量研究 37
4.1 数名结构 37
4.2 实验设计 38
4.2.1 语料标注 38
4.2.2 获取数名结构 39
4.3 分散度 40
4.4 实验结果及分析 42
4.5 本章小结 44
第5章 量名搭配的句法语义分析 45
5.1 复杂数量名短语的识别 46
5.1.1 名词短语识别概述 46
5.1.2 复杂数量名短语界定 48
5.1.3 系统流程 49
5.1.4 量名搭配词典的构建 50
5.1.5 右边界识别算法 53
5.1.6 实验结果及分析 56
5.2 量名搭配统计结果 59
5.3 量词对名词的语义选择倾向 62
5.3.1 选择倾向 62
5.3.2 量名搭配的特点 62
5.3.3 获取方法 63
5.3.4 实验结果及分析 66
5.4 基于量词的名词概念获取 69
5.4.1 概念获取 69
5.4.2 基于量词的名词概念描述 70
5.4.3 聚类方法 71
5.4.4 评价方法 72
5.4.5 实验设计 73
5.5 本章小结 77
第6章 复合名词短语的研究 79
6.1 复合名词短语概述 79
6.1.1 复合名词短语定义 79
6.1.2 复合名词短语的特点 80
6.1.3 复合名词短语的相关研究 81
6.2 复合名词短语的自动获取 83
6.2.1 问题提出 83
6.2.2 数据准备 83
6.2.3 统计指标 85
6.2.4 基于机器学习模型SVM的实验 92
6.2.5 讨论 95
6.3 复合名词短语的语义解释 97
6.3.1 问题概述 97
6.3.2 汉语复合名词短语的释义方法 100
6.3.3 动词获取 100
6.3.4 释义短语生成 104
6.3.5 释义短语过滤 105
6.3.6 实验结果 109
6.3.7 结果分析 110
6.4 基于相似度计算的复合名词短语推荐 113
6.4.1 问题概述 113
6.4.2 研究思路 113
6.4.3 词语相似度计算 114
6.4.4 短语相似度计算 117
6.4.5 实验数据及结果 118
6.5 本章小结 119
第7章 总结与展望 120
7.1 总结 120
7.2 进一步工作 121
附录A 语料库词性标记与词典词类代码对照表 124
附录B 复杂数量名短语的识别结果样例 126
附录C 6.3节中实验所用的复合名词短语样例 129
附录D 基于相似度计算的复合名词短语推荐样例 130
后记 131
参考文献 135