第一部分 理论 3
第1章 前言 3
目标 3
链接分析 3
历史回顾 3
信息科学视角的链接分析是什么? 4
内容与结构 5
关键术语 6
小结 7
阅读与提高 7
参考文献 7
第2章 网络爬虫与搜索引擎 9
目标 9
引言 9
网络爬虫 9
查找网页 10
内容遍历与地址遍历 11
内容遍历 12
动态链接 13
遍历深度与人为限制 13
动态网页 14
道德规范和robot.txt文档 15
网页 15
网络爬虫小结 16
搜索引擎 16
公认的偏好 17
搜索引擎排序 17
网络档案 18
小结 18
阅读与提高 18
参考文献 18
第3章 链接统计的理论基础 20
目标 20
引言 20
链接统计的理论基础 20
异常 21
手工过滤和禁止列表 22
选择性文档模型(Alternative Document Model,简称ADM) 23
网站和网络文档 23
ADMs和标准ADM统计 24
ADM域统计模型 26
选择链接统计方法 26
小结 27
阅读与提高 27
参考文献 28
第4章 对链接数的解释:随机样本与相关性 29
目标 29
引言 29
解释链接数 29
初步的可行性和有效性研究 30
全面的随机抽样 31
分类结果的置信度 32
相关性检验 34
文献回顾 35
小结 35
阅读与提高 35
参考文献 35
第二部分 Web结构 41
第5章 Web图中的链接结构 41
目标 41
引言 41
Web中的幂定律 42
Web增长模型 43
链接拓扑结构 45
学术Web中的幂定律与链接拓扑结构 46
小结 47
阅读与提高 48
参考文献 48
第6章 Web的内容结构 50
目标 50
介绍 50
Web的主题结构 50
基于“链接—内容”的Web增长模型 52
链接文本 52
学术Web中的学科结构 52
共链 57
小结 57
阅读与提高 57
参考文献 57
第三部分 学术链接 61
第7章 大学:链接类型 61
目标 61
引言 61
引文分析 61
大学网站的作用 62
一国范围内的大学网站体系 62
页面类型 63
链接类型 66
小结 68
阅读与提高 69
参考文献 69
第8章 大学:链接模型 71
目标 71
引言 71
入链数和研究之间的关系 71
学术链接:质量与数量 73
备选的逻辑链接模型 75
数学模型 76
地理因素的影响 76
地区性群组 77
小结 78
参考文献 79
第9章 大学:国际链接 80
目标 80
引言 80
国内链接与国际链接 80
国际链接比较 81
语言的影响 83
小结 84
阅读与提高 85
参考文献 85
第10章 院系和学科 87
目标 87
引言 87
院系网站 88
链接类型中的学科差异 88
规模和相关性检验 90
地理和国际因素 91
小结 91
阅读与提高 91
参考文献 91
第11章 期刊和论文 93
目标 93
引言 93
期刊影响因子 93
期刊网站 94
期刊网站入链:存在的问题 94
期刊网站入链:案例研究 95
期刊论文中链接的类型 96
数字图书馆链接 97
与日志文件分析的结合 97
相关研究主题 98
小结 98
阅读与提高 99
参考文献 99
第四部分 应用 103
第12章 搜索引擎与网站设计 103
目标 103
引言 103
链接结构和爬虫爬行范围 103
网站中的文本和向量空间模型 103
PageRank算法 104
案例研究:门户网站中的PageRank计算 107
HITS算法 109
HITS算法的原理示例 110
小结:根据PageRank算法和HITS算法进行网站设计 113
阅读与提高 114
附录:向量空间模型(Vector Space Mode1,简称VSM) 114
参考文献 115
第13章 西班牙大学网站健康度检验 117
目标 117
前言 117
研究问题 117
研究方法 117
结果与讨论 118
结论 123
参考文献 123
第14章 链向大学网站的个人网页 124
目标 124
引言 124
网络信息发布与个人主页 125
研究问题 126
研究方法 126
数据搜集 127
数据分析 127
结果 129
ISP偏好检验 129
ADM匹配 129
链接与研究绩效的相关性 130
来自大学网站的入链与来自个人主页的入链之间的比较 132
个人网页分类 132
结论 136
小结 136
致谢 137
参考文献 137
第15章 学术网络 140
目标 140
引言 140
研究方法 140
大学网站地图 140
国内学术网络图 143
学科地图 144
小结 147
阅读与提高 147
参考文献 148
第16章 商业网站 149
目标 149
引言 149
网站覆盖范围检查 149
站点索引和排名 149
竞争情报 150
案例研究 150
Center Parcs 151
Hoseasons 152
Butlins 152
Pontins 153
Haven Holiday 153
通用查询 154
小结 155
阅读与提高 155
参考文献 155
第五部分 工具和方法 159
第17章 商业搜索引擎和网络档案的使用 159
目标 159
引言 159
检验结果 159
处理结果的变化 160
使用多个搜索引擎 161
使用网络档案 161
小结 161
在线资源 162
阅读与提高 163
参考文献 163
第18章 个人爬虫 164
目标 164
引言 164
个人爬虫类型 164
SocSciBot 165
检索到的网页 165
网页的限制条件 166
网络链接提取 166
来自HTTP的URL 167
模糊的或未详细说明的URL 167
动态页面 168
错误处理 168
爬行中的人为干预 169
SocSciBot tools 169
小结 170
在线资源 170
阅读与提高 170
参考文献 172
第19章 数据清理 173
目标 173
引言 173
数据清理方法概述 173
识别异常 173
TLD光谱分析 174
小结 175
在线资源 175
参考文献 175
第20章 大学在线链接数据库 176
目标 176
引言 176
链接数据库概述 176
链接结构文件 177
禁止列表 178
数据分析 178
其他链接结构数据库 178
小结 178
在线资源 179
阅读与提高 179
参考文献 180
第21章 嵌入式链接分析方法 181
目标 181
引言 181
网络空间分析(Web Sphere Analysis,简称WSA) 181
虚拟民族志(Virtual Ethnography) 182
小结 183
阅读与提高 183
参考文献 183
第22章 社会网络分析 184
目标 184
引言 184
SNA指标 184
软件 186
小结 186
阅读与提高 186
参考文献 187
第23章 网络可视化 188
目标 188
引言 188
网络图表 188
大型网络图表 190
多维尺度分析 190
自组织地图 191
认知领域可视化 191
小结 191
在线资源 192
参考文献 193
第24章 学术链接指标 195
目标 195
引言 195
作为过程指标的网络指标 195
规模和可靠性问题 196
基准指标 197
链接计量指标 197
相关指标 198
其他计量指标 199
小结 199
阅读与提高 200
参考文献 200
第六部分 总结 205
第25章 总结 205
目标 205
引言 205
信息科学对链接分析的贡献 206
其他的链接分析方法 207
未来的方向 207
第26章 术语表 208
参考文献 210
附录:SocSciBot使用指南 211
使用指南 211
第一步:安装SocSciBot、SocSciBot Tools和Cyclist 211
第二步:安装Pajek 212
第三步:使用SocSciBot爬取第一个网站 212
第四步:使用SocSciBot爬行另外两个网站 216
第五步:浏览SocSciBot Tools生成的关于“small test”项目的基本报告 216
第六步:使用Pajek生成网络图 219
第七步:浏览Pajek生成的站点图 223
第八步:使用Cyclist 224
小结 225