1 绪论 1
1.1 研究背景及意义 1
1.2 研究现状 5
1.2.1 社会化标注系统研究 5
1.2.2 社会化标注系统中标签的语义标注研究 5
1.2.3 社会化标注系统中检索的排序算法研究 8
1.3 研究范围界定与思路 11
1.3.1 研究范围的界定 11
1.3.2 基本假设 12
1.3.3 研究思路 12
1.4 研究内容安排与创新点 14
1.4.1 研究内容安排 14
1.4.2 创新点 15
1.5 本章小结 16
2 社会化标注系统标签语义检索模型研究 18
2.1 社会化标注介绍 18
2.1.1 社会化标注的发展历程 18
2.1.2 社会化标注的定义与系统模型 19
2.1.3 社会化标注系统要素分析 22
2.1.4 社会化标注系统标签检索的不足 29
2.2 潜在语义分析简介 32
2.2.1 潜在语义分析概述 32
2.2.2 潜在语义分析的数学依据 33
2.3 基于潜在语义分析的标签语义检索 35
2.3.1 语义检索 35
2.3.2 基于潜在语义分析的标签语义检索模型 39
2.4 本章小结 42
3 基于LSA的社会化标注系统语义标注研究 44
3.1 传统资源模型 44
3.2 改进资源模型 46
3.2.1 标注频数与局部权重 47
3.2.2 条件熵与标签全局权重 47
3.2.3 互信息与资源全局权重 50
3.3 矩阵生成与奇异值分解 52
3.4 语义空间更新 55
3.5 本章小结 57
4 社会化标注系统标签语义检索相似度计算与排序研究 58
4.1 相似度计算比较分析与改进 58
4.2 排序算法介绍 61
4.2.1 PageRank算法 61
4.2.2 HITS算法 63
4.2.3 基于检索用户排序算法 65
4.2.4 FolkRank算法 67
4.2.5 GRank算法 69
4.2.6 GFolkRank算法 70
4.2.7 SocialSimRank算法 70
4.2.8 SocialPageRank算法 71
4.3 排序算法改进 72
4.3.1 利用相似用户来修正排序 72
4.3.2 考虑时序特性来修正排序 76
4.3.3 相似度计算修正 80
4.4 本章小结 81
5 社会化标注系统标签语义检索实证研究——以delicious.com为例 82
5.1 数据获取与实验 82
5.2 分析与评价 83
5.3 中文标签的检索 89
5.4 本章小结 90
6 总结与展望 91
6.1 总结 91
6.2 展望 92
附录A 抓取的部分原始数据 93
附录B 整理出的数据 97
附录C 资源标注频次数据 102
附录D 标签标注频次数据 106
附录E 资源与资源代码 115
附录F 奇异值分解后的T,S,D矩阵 122
附录G 基于LSA的余弦相似度修正计算排序结果 123
附录H 基于VSM的余弦相似度计算结果 127
附录I 与检索提问式相关的52个核心资源 131
附录J 基于LSA的查全率计算结果 132
附录K 基于VSM的查全率计算结果 136
附录L 基于LSA的查准率计算结果 140
附录M 基于VSM的查准率计算结果 144
参考文献 148