《链接分析 信息科学的研究方法》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:(英)塞沃尔(Thelwall,M.)著,孙建军等译
  • 出 版 社:南京:东南大学出版社
  • 出版年份:2009
  • ISBN:9787564112790
  • 页数:225 页
图书介绍:作为第一部链接分析专著,英国知名学者Mike Thelwall的Link Anal:An Information Science Approach被译成中文,可较大程度推动国内链接分析研究及相关教育工作。本书通过大量的方法、工具、技术介绍及案例分析,向读者展示整个链接分析研究的全貌。

第一部分 理论 3

第1章 前言 3

目标 3

链接分析 3

历史回顾 3

信息科学视角的链接分析是什么? 4

内容与结构 5

关键术语 6

小结 7

阅读与提高 7

参考文献 7

第2章 网络爬虫与搜索引擎 9

目标 9

引言 9

网络爬虫 9

查找网页 10

内容遍历与地址遍历 11

内容遍历 12

动态链接 13

遍历深度与人为限制 13

动态网页 14

道德规范和robot.txt文档 15

网页 15

网络爬虫小结 16

搜索引擎 16

公认的偏好 17

搜索引擎排序 17

网络档案 18

小结 18

阅读与提高 18

参考文献 18

第3章 链接统计的理论基础 20

目标 20

引言 20

链接统计的理论基础 20

异常 21

手工过滤和禁止列表 22

选择性文档模型(Alternative Document Model,简称ADM) 23

网站和网络文档 23

ADMs和标准ADM统计 24

ADM域统计模型 26

选择链接统计方法 26

小结 27

阅读与提高 27

参考文献 28

第4章 对链接数的解释:随机样本与相关性 29

目标 29

引言 29

解释链接数 29

初步的可行性和有效性研究 30

全面的随机抽样 31

分类结果的置信度 32

相关性检验 34

文献回顾 35

小结 35

阅读与提高 35

参考文献 35

第二部分 Web结构 41

第5章 Web图中的链接结构 41

目标 41

引言 41

Web中的幂定律 42

Web增长模型 43

链接拓扑结构 45

学术Web中的幂定律与链接拓扑结构 46

小结 47

阅读与提高 48

参考文献 48

第6章 Web的内容结构 50

目标 50

介绍 50

Web的主题结构 50

基于“链接—内容”的Web增长模型 52

链接文本 52

学术Web中的学科结构 52

共链 57

小结 57

阅读与提高 57

参考文献 57

第三部分 学术链接 61

第7章 大学:链接类型 61

目标 61

引言 61

引文分析 61

大学网站的作用 62

一国范围内的大学网站体系 62

页面类型 63

链接类型 66

小结 68

阅读与提高 69

参考文献 69

第8章 大学:链接模型 71

目标 71

引言 71

入链数和研究之间的关系 71

学术链接:质量与数量 73

备选的逻辑链接模型 75

数学模型 76

地理因素的影响 76

地区性群组 77

小结 78

参考文献 79

第9章 大学:国际链接 80

目标 80

引言 80

国内链接与国际链接 80

国际链接比较 81

语言的影响 83

小结 84

阅读与提高 85

参考文献 85

第10章 院系和学科 87

目标 87

引言 87

院系网站 88

链接类型中的学科差异 88

规模和相关性检验 90

地理和国际因素 91

小结 91

阅读与提高 91

参考文献 91

第11章 期刊和论文 93

目标 93

引言 93

期刊影响因子 93

期刊网站 94

期刊网站入链:存在的问题 94

期刊网站入链:案例研究 95

期刊论文中链接的类型 96

数字图书馆链接 97

与日志文件分析的结合 97

相关研究主题 98

小结 98

阅读与提高 99

参考文献 99

第四部分 应用 103

第12章 搜索引擎与网站设计 103

目标 103

引言 103

链接结构和爬虫爬行范围 103

网站中的文本和向量空间模型 103

PageRank算法 104

案例研究:门户网站中的PageRank计算 107

HITS算法 109

HITS算法的原理示例 110

小结:根据PageRank算法和HITS算法进行网站设计 113

阅读与提高 114

附录:向量空间模型(Vector Space Mode1,简称VSM) 114

参考文献 115

第13章 西班牙大学网站健康度检验 117

目标 117

前言 117

研究问题 117

研究方法 117

结果与讨论 118

结论 123

参考文献 123

第14章 链向大学网站的个人网页 124

目标 124

引言 124

网络信息发布与个人主页 125

研究问题 126

研究方法 126

数据搜集 127

数据分析 127

结果 129

ISP偏好检验 129

ADM匹配 129

链接与研究绩效的相关性 130

来自大学网站的入链与来自个人主页的入链之间的比较 132

个人网页分类 132

结论 136

小结 136

致谢 137

参考文献 137

第15章 学术网络 140

目标 140

引言 140

研究方法 140

大学网站地图 140

国内学术网络图 143

学科地图 144

小结 147

阅读与提高 147

参考文献 148

第16章 商业网站 149

目标 149

引言 149

网站覆盖范围检查 149

站点索引和排名 149

竞争情报 150

案例研究 150

Center Parcs 151

Hoseasons 152

Butlins 152

Pontins 153

Haven Holiday 153

通用查询 154

小结 155

阅读与提高 155

参考文献 155

第五部分 工具和方法 159

第17章 商业搜索引擎和网络档案的使用 159

目标 159

引言 159

检验结果 159

处理结果的变化 160

使用多个搜索引擎 161

使用网络档案 161

小结 161

在线资源 162

阅读与提高 163

参考文献 163

第18章 个人爬虫 164

目标 164

引言 164

个人爬虫类型 164

SocSciBot 165

检索到的网页 165

网页的限制条件 166

网络链接提取 166

来自HTTP的URL 167

模糊的或未详细说明的URL 167

动态页面 168

错误处理 168

爬行中的人为干预 169

SocSciBot tools 169

小结 170

在线资源 170

阅读与提高 170

参考文献 172

第19章 数据清理 173

目标 173

引言 173

数据清理方法概述 173

识别异常 173

TLD光谱分析 174

小结 175

在线资源 175

参考文献 175

第20章 大学在线链接数据库 176

目标 176

引言 176

链接数据库概述 176

链接结构文件 177

禁止列表 178

数据分析 178

其他链接结构数据库 178

小结 178

在线资源 179

阅读与提高 179

参考文献 180

第21章 嵌入式链接分析方法 181

目标 181

引言 181

网络空间分析(Web Sphere Analysis,简称WSA) 181

虚拟民族志(Virtual Ethnography) 182

小结 183

阅读与提高 183

参考文献 183

第22章 社会网络分析 184

目标 184

引言 184

SNA指标 184

软件 186

小结 186

阅读与提高 186

参考文献 187

第23章 网络可视化 188

目标 188

引言 188

网络图表 188

大型网络图表 190

多维尺度分析 190

自组织地图 191

认知领域可视化 191

小结 191

在线资源 192

参考文献 193

第24章 学术链接指标 195

目标 195

引言 195

作为过程指标的网络指标 195

规模和可靠性问题 196

基准指标 197

链接计量指标 197

相关指标 198

其他计量指标 199

小结 199

阅读与提高 200

参考文献 200

第六部分 总结 205

第25章 总结 205

目标 205

引言 205

信息科学对链接分析的贡献 206

其他的链接分析方法 207

未来的方向 207

第26章 术语表 208

参考文献 210

附录:SocSciBot使用指南 211

使用指南 211

第一步:安装SocSciBot、SocSciBot Tools和Cyclist 211

第二步:安装Pajek 212

第三步:使用SocSciBot爬取第一个网站 212

第四步:使用SocSciBot爬行另外两个网站 216

第五步:浏览SocSciBot Tools生成的关于“small test”项目的基本报告 216

第六步:使用Pajek生成网络图 219

第七步:浏览Pajek生成的站点图 223

第八步:使用Cyclist 224

小结 225