第1章 绪论 1
1.1 术语相似度计算研究缘起 1
1.2 研究的目的及意义 2
1.2.1 研究目的 2
1.2.2 研究意义 3
1.3 相关概念界定 4
1.3.1 术语 4
1.3.2 术语语义相似度 4
1.4 研究思路与方法 5
1.4.1 研究思路 5
1.4.2 研究方法 6
1.5 本书内容组织结构 6
第2章 术语相似度计算研究概述 8
2.1 术语相似度计算相关研究 8
2.1.1 术语相似性测度研究 9
2.1.2 基于语词构成特征的术语相似度算法研究 9
2.1.3 基于句法特征的术语相似度算法研究 15
2.1.4 基于语境特征的术语相似度算法研究 17
2.1.5 基于语词知识体系的术语相似度算法研究 19
2.1.6 基于网络知识资源的术语相似度算法研究 20
2.1.7 术语相似度指标集成算法研究 23
2.1.8 术语语义相似度计算应用研究 24
2.2 术语相似度计算技术路线评述 27
2.2.1 典型算法计算思路的特点 27
2.2.2 典型算法计算思路的不足 28
2.3 术语相似度计算改进思路 29
2.3.1 计算方法的改进 30
2.3.2 集成模型的改进 31
2.4 小结 32
第3章 术语主词软匹配相似度算法研究 33
3.1 SSHW算法的提出 33
3.2 SSHW算法思想及算法设计 35
3.2.1 SSHW算法思想 35
3.2.2 SSHW算法设计 37
3.3 SSHW算法实现 40
3.4 SSHW算法评测 41
3.4.1 实验目的 41
3.4.2 实验数据 41
3.4.3 实验过程 43
3.4.4 数据分析 44
3.4.5 实验结论 52
3.5 小结 53
第4章 Hearst句法模板相似度改进算法研究 54
4.1 Hearst句法模板相似度算法改进思路 54
4.2 算法设计 55
4.2.1 算法设计思路 55
4.2.2 算法表达 56
4.3 算法实现 57
4.3.1 句法模板构建 57
4.3.2 计算过程 61
4.4 算法评测 62
4.4.1 实验目的 63
4.4.2 实验数据 63
4.4.3 实验过程 63
4.4.4 数据分析 63
4.4.5 实验结论 65
4.5 小结 66
第5章 语境依赖关系模式相似度算法研究 67
5.1 DRCP算法的提出 67
5.2 DRCP算法思想及算法设计 69
5.2.1 DRCP算法思想 69
5.2.2 DRCP算法设计 70
5.3 DRCP算法实现 71
5.4 DRCP算法评测 74
5.4.1 实验目的 74
5.4.2 实验数据 74
5.4.3 实验过程 75
5.4.4 数据分析 77
5.4.5 实验结论 80
5.5 小结 81
第6章 领域限定网络检索相似度算法研究 83
6.1 Web-PMI算法的改进思路 83
6.2 算法改进设计 84
6.2.1 基于领域特征的检索式构造 85
6.2.2 基于命中数的术语相似度计算 87
6.3 算法实现 88
6.3.1 算法结构 88
6.3.2 搜索引擎的选择 89
6.4 算法评测 90
6.4.1 实验目的 91
6.4.2 实验数据 91
6.4.3 实验过程 91
6.4.4 数据分析 92
6.4.5 实验结论 95
6.5 小结 96
第7章 基于机器学习的术语相似度集成计算模型 98
7.1 集成计算模型的提出 98
7.2 集成计算设计 100
7.2.1 学习阶段模型设计 101
7.2.2 计算阶段框架设计 102
7.3 集成计算实现 103
7.3.1 相似度网络初始化 103
7.3.2 相似度网络的检索和推导机制 105
7.3.3 语词相似度计算 107
7.3.4 句法相似度计算 107
7.3.5 语境相似度计算 108
7.3.6 搜索引擎相似度计算 108
7.3.7 相似度指标的SVM集成 108
7.4 集成计算评测 111
7.4.1 实验目的 111
7.4.2 实验数据 111
7.4.3 实验过程 112
7.4.4 数据分析 113
7.4.5 实验结论 118
7.5 小结 120
第8章 结束语 121
参考文献 124
附录1 人工智能领域人工判断为相似的测试术语集合 129
附录2 人工智能领域人工判断为不相似的测试术语集合 150
附录3 基因工程领域人工判断为相似的测试术语集合 169
附录4 基因工程领域人工判断为不相似的测试术语集合 192
附录5 Stanford Dependencies解析得到的依赖关系类型及描述 213