第一章 绪论 1
1.1背景及意义 1
1.2国内外研究现状 2
1.3平台及工具研发 7
1.4章节结构安排 9
1.5本章小节 11
参考文献 11
第二章 专利技术术语抽取方法 16
2.1引言 16
2.2术语的定义、分类和特征 16
2.3自动术语抽取的方法 19
2.4中文术语抽取研究的概述 21
2.5专利技术术语抽取模型 23
2.6实验结构及讨论 31
2.7本章小节 41
参考文献 41
第三章 共现聚类分析的新方法:最大频繁项集挖掘 44
3.1引言 44
3.2共现分析法 45
3.3最大频繁项集挖掘 50
3.4实验结果及讨论 53
3.5本章小结 56
参考文献 56
第四章 基于双序列比对的中文术语语义相似度计算方法 58
4.1引言 58
4.2《同义词词林》简介 59
4.3 Ⅰ型问题的语义相似度计算 61
4.4 Ⅱ型问题的语义相似度计算 62
4.5实验结果及讨论 67
4.6本章小结 69
参考文献 70
第五章 仅根据Proximity数据构建向量空间模型的方法 72
5.1引言 72
5.2基于MDS的向量空间模型构建方法 73
5.3实验材料及数据 76
5.4实验结果及分析 77
5.5本章小结 82
参考文献 83
第六章 基于弱监督学习的语义关系抽取方法 85
6.1引言 85
6.2国内外研究现状 86
6.3实体关系抽取模型 91
6.4实验结果及分析 100
6.5本章小结 105
参考文献 106
第七章 几种叙词表复杂逻辑错误检查算法研究 109
7.1引言 109
7.2预备知识 110
7.3属/分关系中的逻辑错误检查算法 111
7.4参考关系中的逻辑错误检查算法 113
7.5本章小结 115
参考文献 116
第八章 融合科技文献内外部特征的主题模型发展综述 117
8.1引言 117
8.2历史渊源及符号表示 119
8.3融合科研人员特征 121
8.4融合时间特征 126
8.5融合参考文献特征 129
8.6融合多个外部特征 133
8.7本章小结 136
参考文献 137
第九章 论文和专利资源主题关联分析方法 141
9.1引言 141
9.2技术路线 142
9.3技术主题抽取 143
9.4词项和命名实体聚类 148
9.5主题相似度计算 150
9.6技术主题关联 152
9.7实验结果及讨论 154
9.8本章小节 159
参考文献 159
第十章 基于事实型数据的技术生命周期判断方法综述 164
10.1引言 164
10.2技术生命周期阶段划分 165
10.3技术生命周期阶段判断方法 169
10.4本章小结 177
参考文献 179
第十一章 面向情报技术领域的Loglet分析 182
11.1引言 182
11.2增长曲线模型 183
11.3实验数据选取 186
11.4 LogletLab简介 190
11.5实验结果及分析 191
11.6本章小结 195
参考文献 195
第十二章 专利技术功效图智能构建进展 197
12.1引言 197
12.2技术功效图概述 198
12.3技术功效图构建模式 200
12.4关键技术研究进展 203
12.5本章小结 207
参考文献 208
附录1词性说明 210
附录2 FAO-780数据集前25条高频术语组成的共现信息矩阵C 212
附录3 FAO-780数据集挖掘得到的所有最大频繁项集 214
附录4原子术语及相应的编码 218