1引言 1
1.1研究背景与意义 1
1.1.1研究背景 1
1.1.2研究意义 6
1.2国内外研究现状分析 8
1.2.1国内研究现状 9
1.2.2国外研究现状 19
1.2.3国内外研究述评 26
1.3研究目标与数据采集 28
1.3.1研究目标 28
1.3.2数据采集 28
1.4本书创新之处 30
2科学知识多元计量聚合的理论基础 32
2.1数字文献资源 32
2.1.1数字文献资源的概念和特点 32
2.1.2数字文献资源的构成要素 34
2.2数字资源整合 36
2.2.1数字资源整合的概念 36
2.2.2数字资源整合的模式 37
2.2.3知识聚合与资源整合的关系 43
2.3信息搜寻与检索 45
2.3.1用户信息行为 45
2.3.2信息搜寻和检索模型 46
2.3.3信息搜寻和检索与知识聚合的关系 50
2.4信息计量学中的集中与离散分布 54
2.4.1幂律形式的集中与离散分布现象 54
2.4.2集中和离散分布与知识聚合的关系 56
2.5科学知识多元计量聚合的理论定位 57
2.6本章小结 60
3科学知识多元计量聚合的理论模型与特性 62
3.1科学知识多元计量聚合的理论模型 62
3.1.1科学知识多元计量聚合的概念认知 62
3.1.2科学知识多元计量聚合模型 64
3.2数字文献资源聚合的多元性 67
3.2.1对象元素的多元性 67
3.2.2关联网络的多元性 70
3.2.3测度层次的多元性 73
3.2.4目标结构的多元性 77
3.3科学知识多元计量聚合的深度特性 80
3.3.1聚合的深化过程 80
3.3.2不同对象的聚合重点和挖掘深度 82
3.4本章小结 84
4科学知识多元计量聚合技术与方法研究 86
4.1科学知识多元计量聚合的流程框架 86
4.2聚合对象的重要性评价 88
4.2.1局部视角的重要性指标 89
4.2.2全局视角的重要性指标 92
4.2.3各类重要性指标的比较 94
4.3资源聚合挖掘的方法 96
4.3.1以资源节点为中心的聚合 97
4.3.2以聚类为中心的聚合 98
4.3.3以相对重要性为中心的聚合 103
4.4资源聚合的语义分析方法 107
4.4.1基于词频的语义分析 107
4.4.2基于共词分析的语义分析 109
4.4.3基于主题模型的语义分析 111
4.5本章小结 114
5引文网络中科学知识多元计量聚合实证研究 116
5.1引文分析概述 116
5.1.1引文分析的基本概念 116
5.1.2局部引文分析 118
5.1.3全局引文网络分析 121
5.2基于遍历值的重要性计算 123
5.2.1遍历权重的特点 123
5.2.2遍历计数计算方法 124
5.2.3遍历权重转化 126
5.3基于LDA主题模型的语义分析 127
5.3.1 LDA主题模型解析 127
5.3.2试验对象的语义主题分析 130
5.3.3文献聚合的语义主题获取 133
5.4基于相对值的知识计量聚合 134
5.4.1引文数据清洗与统计描述 134
5.4.2基于阈值的资源聚合 138
5.4.3基于论文相对重要性的知识聚合 144
5.4.4基于引用关系相对重要性的知识聚合 149
5.4.5整体趋势分析与聚合结果对比 159
5.5本章小结 162
6作者关联网络中科学知识多元计量聚合实证研究 164
6.1作者知识关联网络及其语义内涵 165
6.1.1作者知识关联网络的类型 165
6.1.2关联网络数据的抽取 167
6.1.3网络结构数据存储模型 169
6.1.4作者知识关联网络的语义内涵 170
6.2作者主题语义分析 173
6.2.1作者名称数据清洗与规范 173
6.2.2加入作者的主题模型 177
6.2.3作者主题语义分析结果 180
6.2.4作者聚合的语义主题获取 183
6.3作者关联网络的相关性 184
6.3.1关系相关性测度方法 184
6.3.2相关性分析结果 185
6.4作者关联网络的资源语义聚合 188
6.4.1网络中作者重要性计算 188
6.4.2基于相对值的作者语义聚合 190
6.4.3作者关联网络语义聚合对比 206
6.5本章小结 209
7结语 211
7.1研究总结 211
7.2不足与展望 213
附录1 主题模型分析结果 216
附录2 作者主题模型分析结果 231
附录3 引文网络相对值聚合结果 251
附录4 380名作者的加权PageRank计算结果 276
参考文献 292