第1章 绪论 1
1.1 语义网 1
1.2 本体构建 3
1.3 本体学习的研究历程和现状 4
1.3.1 国外研究概述 5
1.3.2 国内研究概述 10
1.3.3 国内外研究评价 16
1.4 本书研究内容 17
1.5 本书研究意义 18
第2章 本体基本概念和理论 20
2.1 本体的起源 20
2.2 本体的定义 21
2.2.1 国外学者对于本体的定义 21
2.2.2 国内学者对于本体的理解 25
2.3 本体的分类 27
2.4 本体的主要描述语言 28
2.4.1 本体描述语言特征 29
2.4.2 主要的本体描述语言 30
2.5 本体的作用 41
2.6 本体学习工具 42
2.6.1 Hasti 43
2.6.2 OntoLearn 45
2.6.3 Text-To-Onto 46
2.6.4 OntoBuilder 47
2.6.5 OntoLiFT 48
2.6.6 GOLF 49
2.6.7 OntoSphere 50
2.6.8 各本体学习工具比较分析 51
2.7 本体与叙词表的对比分析 52
2.7.1 术语与概念 52
2.7.2 叙词表的概念和应用 53
2.7.3 本体与叙词表的对比分析 54
2.8 本章小结 55
第3章 学科术语分类关系抽取 57
3.1 方法描述 58
3.2 数据基础 59
3.3 术语抽取 59
3.3.1 初步抽取 59
3.3.2 二次抽取 62
3.4 术语×文档向量空间模型构建 62
3.4.1 非结构化文本NLPIR分词 63
3.4.2 术语×文档频数矩阵 64
3.4.3 术语×文档权重矩阵 65
3.5 改进的术语×文档向量空间模型构建 69
3.5.1 改进原因及方法 69
3.5.2 基于扫描的文档术语语义关联 71
3.5.3 基于扫描的术语×文档频数矩阵 72
3.5.4 基于扫描的术语×文档权重矩阵 73
3.6 术语×词汇向量空间模型构建 74
3.6.1 术语共现关系中介的转变 75
3.6.2 术语×词汇频数矩阵 77
3.6.3 术语×词汇权重矩阵 78
3.7 学科术语分类关系抽取 79
3.7.1 BIRCH算法预聚类 79
3.7.2 层次聚类 81
3.7.3 类标签的确定 83
3.7.4 实验结果及分析 84
3.7.5 与现有方法及技术的对比 88
3.8 本章小结 90
第4章 学科术语非分类关系抽取 91
4.1 方法描述 92
4.2 关联规则分析 93
4.2.1 关联规则及其有效性和实用性 93
4.2.2 Apriori算法 96
4.2.3 GRI算法 97
4.3 关联术语对的抽取 98
4.3.1 句子×术语向量空间模型构建 98
4.3.2 关联术语对的抽取 99
4.4 学科领域动词的抽取 108
4.4.1 NLPIR词性标注分词 108
4.4.2 学科领域动词的抽取 109
4.5 非分类关系标签的分配 110
4.6 与现有方法及技术的对比 112
4.7 本章小结 113
第5章 学科术语本体的描述和存储 114
5.1 本体的逻辑描述 114
5.1.1 本体描述语言OWL概述 114
5.1.2 学科术语本体的OWL描述 114
5.2 本体的存储 117
5.2.1 本体存储方式 119
5.2.2 关系数据库存储模式 122
5.2.3 学科术语本体存储模式的设计 124
5.2.4 学科术语本体的存储 125
5.3 本章小结 127
第6章 学科术语本体的可视化 129
6.1 本体可视化工具 130
6.1.1 Protégé 130
6.1.2 ToughGraph 133
6.1.3 Prefuse 136
6.2 基于Protégé的学科术语本体可视化 137
6.2.1 分类关系的可视化 137
6.2.2 非分类关系可视化 139
6.3 本章小结 140
第7章 总结与展望 142
7.1 学科术语本体构建的关键内容 142
7.2 学科术语本体构建中存在的问题 144
7.3 后续研究 145
参考文献 146