第1章 绪论 1
1.1 国内外研究现状及分析 1
1.1.1 国内外研究现状 1
1.1.2 国内外研究分析 5
1.2 本书的主要研究工作与创新点 6
1.2.1 本书主要研究工作 6
1.2.2 本书创新点 7
第2章 概念相似度/相关度计算方法 9
2.1 概念相似度计算中的本体和语料库 9
2.1.1 WordNet本体简介 9
2.1.2 语料库简介 24
2.2 概念相似度和相关度关系 25
2.3 概念语义相似度计算的既有研究成果 26
2.4 本体的树结构(HCT)和图结构(HCG) 32
2.4.1 HCT和HCG 32
2.4.2 WordNet中的HCT和HCG结构 32
2.4.3 HCT和HCG结构中影响语义相似度和相关度的因素 33
2.5 基于HCT本体结构的语义相似度 36
2.5.1 方法起源 36
2.5.2 概念相似度计算的相关定义 38
2.5.3 概念节点密度和相关概念节点对相似度计算的影响 40
2.5.4 概念相似度计算 44
2.6 基于HCG本体结构的语义相关度 45
2.6.1 HCT结构和HCG结构的关系 45
2.6.2 HCG中的整体部分关系的分类 46
2.6.3 将HCG转换为HCT的方法 51
2.7 案例分析 53
2.7.1 案例1利用某大学信息学院本体来计算概念相关度 53
2.7.2 案例2 WordNet本体 58
2.8 小结 66
第3章 语句相似度计算方法 68
3.1 语句相似度计算简介 68
3.2 语句相似度计算的既有研究成果 68
3.3 基于本体的语句相似度计算方法 69
3.3.1 语句相似度计算相关定义 69
3.3.2 基于HCT本体结构的语句相似度计算方法 71
3.4 案例分析 73
3.4.1 案例1基于领域本体计算语句相似度 73
3.4.2 案例2基于MSRP语料库的语句相似度计算 76
3.5 小结 85
第4章 文档相似度计算方法 87
4.1 文档相似度计算简介 87
4.2 文档相似度计算的既有研究成果 87
4.3 基于本体的文档相似度计算方法 88
4.3.1 文档相似度计算相关定义 88
4.3.2 概念节点权重关系 89
4.3.3 基于HCT本体结构的文档相似度计算方法 91
4.4 案例分析 95
4.4.1 案例1基于领域本体计算文档相似度 95
4.4.2 案例2使用Michael D.Lee标准文档数据集计算文档相似度 95
4.5 小结 101
第5章 基于语义的领域搜索引擎 103
5.1 搜索引擎工作原理 103
5.2 基于语义相似度的索引技术 106
5.2.1 相关技术及分析 106
5.2.2 基于语义相似度计算的领域搜索索引技术 106
5.3 基于语义相似度的排序技术 109
5.3.1 已有排序技术与分析 109
5.3.2 基于语义相似度计算的领域搜索排序技术 109
5.4 小结 112
附录 案例分析计算数据 113
附录A 基于某大学信息学院分类的语义相似度计算结果 113
附录B 语句相似度计算结果 120
附录C 文档相似度计算结果 174
参考文献 194