第一部分 网络工具及分析 3
1 利用Map Equation Framwork实现网络的社区发现及可视化 3
1.1 引言 4
1.2 方法综述 5
1.3 Map Equation Framework 7
1.3.1 Map Equation 8
1.3.2 Infomap 18
1.4 Map Equation软件包的操作步骤说明 19
1.4.1 Map EquationWeb应用 20
1.4.2 Infomap命令行软件 28
1.4.3 网络输入和输出格式 30
2 链接预测 36
2.1 引言 36
2.2 链接预测过程及其应用 38
2.3 数据 41
2.4 链接预测工具 42
2.4.1 安装 43
2.4.2 基本用途 43
2.5 链接预测实践 44
2.5.1 前处理 44
2.5.2 预测器选择 45
2.5.3 预测 49
2.5.4 评价和解释 50
2.5.5 配置文件 52
附录:用作Python模型 56
3 网络分析与指标 58
3.1 引言 58
3.2 网络与文献计量学 60
3.3 基本网络特性 61
3.4 网络数据 62
3.5 利用网络科学计量 64
3.6 合作网络 68
3.7 引文网络 77
4 分析引文网络的PageRank相关方法 84
4.1 引言 85
4.2 PageRank 86
4.2.1 PageRank定义 86
4.2.2 PageRank计算 87
4.2.3 阻尼因子参数 88
4.2.4 以随机冲浪方式解释PageRank 88
4.3 文献综述 89
4.3.1 PageRank的前身 89
4.3.2 分析文献引文网络的PageRank方法 90
4.3.3 分析作者引文网络的PageRank方法 92
4.3.4 分析出版物引文网络的PageRank方法 92
4.4 使用说明 93
4.4.1 从Web of Science数据库下载书目数据 94
4.4.2 用Sci2工具建立一个文献引文网络 94
4.4.3 使用MATLAB进行PageRank计算 96
第二部分 科学系统 103
5 系统生命周期及其与三股螺旋的关系 103
5.1 简介 103
5.2 相关研究 105
5.3 实验假设 107
5.4 技术生命周期中的可度量状态 107
5.5 使用工具生成结果的步骤 108
5.6 关于技术准备水平里程碑5的扩展进化 111
5.7 TRL逻辑到改进模型的应用 114
5.8 讨论 121
6 空间科学计量学与学术影响:近期研究、工具及方法综述 126
6.1 引言 126
6.2 综述论文选取 127
6.2.1 综述范围 127
6.2.2 检索过程 128
6.3 综述 129
6.3.1 出版物和引文影响力的空间分布 129
6.3.2 引文影响地理图 134
6.3.3 工具和方法 137
7 科研人员发表模式及其在作者消歧中的应用 142
7.1 引言 143
7.2 文献所属作者判别研究综述 145
7.3 方法 147
7.4 科研人员文献发表模式中的规律 149
附录1:期刊学科列表 161
附录2:院系学科列表 167
8 知识整合与扩散:多样性和连贯性的度量和可视化 170
8.1 引言 170
8.2 概念框架:知识整合和扩散作为认知多样性与连贯性的变化 172
8.3 数据选择和操作方法 179
8.3.1 分析单元 179
8.3.2 将元素划分类别 180
8.3.3 获取关系 184
8.3.4 可视化 185
8.4 如何计算和可视化知识整合 187
8.4.1 多样性测量介绍说明 187
8.4.2 计算一组论文多样性的R脚本 188
第三部分 统计与基于文本的方法 193
9 信息计量研究中的受限因变量模型和概率预测 193
9.1 引言 194
9.2 数据:在信息计量学中哪些文献被引用 195
9.3 二分类变量回归 197
9.4 有序变量回归模型 203
9.5 计数资料模型 208
9.6 Stata中的受限因变量模型 215
10 利用Stanford CoreNLP软件进行文本挖掘 218
10.1 引言 219
10.2 文献计量学研究中的文本挖掘 220
10.3 文本挖掘系统的结构 222
10.4 Stanford CoreNLP分析器 225
10.5 举例说明文本挖掘在文献计量学分析中的应用 229
10.6 结果 234
11 主题模型:使用主题滤镜评价学术影响力 238
11.1 引言 238
11.2 主题模型 240
11.2.1 语言模型(LM) 241
11.2.2 Probabilistic Latent Semantic Indexing模型(pLSI) 242
11.2.3 Latent Dirichlet Allocation模型(LDA) 242
11.2.4 Author-Topic模型 244
11.2.5 Author-Conference-Topic模型 245
11.2.6 Hierarchical Latent Dirichlet Allocation模型(Hierarchical LDA) 246
11.2.7 Citation LDA模型 246
11.2.8 Entity LDA模型 247
11.3 主题模型方法在学术交流中的应用 248
11.4 主题模型工具:案例研究 249
12 机构间引文影响力差别的本质与实际意义:运用效应量与可信区间分析百分位数的指南 261
12.1 引言 262
12.2 百分位数排名 263
12.3 数据与统计软件 265
12.4 效应量及相关概念 266
12.5 Cohen's d(对于个体机构) 271
12.6 机构间的平均值差值 274
12.7 比例(既用于单个机构也用于机构间的比较) 277
附录:用于分析的Stata代码 281
第四部分 可视化 289
13 文献计量网络的可视化 289
13.1 引言 289
13.2 文献综述 290
13.2.1 文献计量网络的类型 291
13.2.2 可视化方法 292
13.3 软件工具 296
13.3.1 通用的网络分析工具 296
13.3.2 文献计量网络分析和可视化工具 297
13.3.3 文献引文网络的分析和可视化工具 298
13.4 技术 299
13.4.1 VOSviewer 299
13.4.2 CitNetExplorer 302
13.5 指导手册 305
13.5.1 数据采集 306
13.5.2 VOSviewer 307
13.5.3 CitNetExplorer 313
附录:VOSviewer使用的标准化、可视化与聚类技术 322
14 可复制的科学学研究 325
14.1 用于科学学研究的开放工具 326
14.2 科学学(Sci2)工具 328
14.2.1 工作流程设计及复制 328
14.2.2 数据读取器 329
14.2.3 时间分析(何时) 330
14.2.4 地理空间分析(何地) 333
14.2.5 主题分析 335
14.2.6 网络分析 337
14.3 职业轨迹 339
14.3.1 数据准备分析 340
14.3.2 数据可视化及解释 341
14.4 讨论与展望 345
参考文献 348