0 引言 1
0.1 选题背景与研究意义 1
0.1.1 选题背景 1
0.1.2 研究意义 4
0.2 国内外研究现状分析 5
0.2.1 查询意图研究现状 5
0.2.2 搜索引擎稳定性研究现状 17
0.2.3 查询个性化潜力研究现状 19
0.2.4 网络动态研究现状 21
0.2.5 研究述评 23
0.3 研究方法与研究思路 24
0.3.1 研究方法 24
0.3.2 研究思路 24
0.4 研究内容与创新 26
0.4.1 研究内容 26
0.4.2 研究创新 26
1 相关理论基础 28
1.1 基于认知的信息检索模型 28
1.1.1 信息需求表达研究 30
1.1.2 相关性研究 32
1.2 查询意图相关理论 35
1.2.1 查询意图概念界定 35
1.2.2 查询意图理解维度 36
1.2.3 查询意图分类体系 38
1.2.4 查询意图分析维度 42
2 查询意图自动分类 44
2.1 查询意图分类体系构建 44
2.2 查询意图分类的相关方法 45
2.2.1 查询表示方法 45
2.2.2 查询意图特征选取的方法 46
2.2.3 查询意图分类算法 47
2.2.4 查询意图分类效果评测 52
2.3 查询意图分类的难点 53
2.4 查询意图特征选取 55
2.4.1 已有的查询意图特征 55
2.4.2 本书提出的查询意图特征 60
2.5 实验及其结果分析 69
2.5.1 数据集获取 69
2.5.2 人工标注 73
2.5.3 查询会话切分 76
2.5.4 查询处理 79
2.5.5 实验设计 84
2.5.6 实验结果分析 86
2.6 实验总结 95
3 查询意图的搜索引擎稳定性分析 97
3.1 搜索引擎稳定性概述 98
3.1.1 搜索引擎不稳定的原因 98
3.1.2 搜索引擎稳定性的概念界定 98
3.2 衡量搜索引擎稳定性的方法 99
3.2.1 基于重叠的方法 99
3.2.2 Spearman's footrule方法 99
3.2.3 Kendall tau方法 100
3.2.4 Fagin's方法 101
3.3 数据集获取 102
3.3.1 搜索引擎的选取 102
3.3.2 实验数据的获取 103
3.4 查询意图的同一搜索引擎稳定性分析 104
3.4.1 基于PURL与TURL指标的稳定性分析 104
3.4.2 基于Kendall tau距离的稳定性分析 110
3.5 查询意图不同搜索引擎之间的稳定性分析 112
3.6 实验总结 112
3.6.1 实验小结 112
3.6.2 相关建议 113
4 查询意图的个性化潜力分析 114
4.1 查询个性化潜力概述 114
4.2 衡量个性化潜力的相关指标 117
4.2.1 显式评测指标 117
4.2.2 隐式评测指标 122
4.3 实验数据来源 126
4.3.1 人工评测数据集 126
4.3.2 其他数据集 128
4.4 实验结果分析 129
4.4.1 查询意图的个性化潜力分析 129
4.4.2 显式与隐式子指标之间的相关性分析 130
4.4.3 查询意图的表征个性化潜力的特征分析 131
4.5 实验总结 134
4.5.1 实验小结 134
4.5.2 相关建议 135
5 查询意图的网络动态分析 136
5.1 衡量网络动态的方法 137
5.1.1 衡量查询动态的方法 137
5.1.2 衡量信息需求动态的方法 142
5.1.3 衡量文档动态的方法 143
5.2 数据集获取 145
5.2.1 查询与结果集的选择 145
5.2.2 基于人工评测的数据 145
5.3 实验结果分析 146
5.3.1 查询意图的查询动态分析 146
5.3.2 查询意图的文档动态分析 148
5.3.3 查询意图随查询动态的文档动态分析 149
5.3.4 查询意图随查询动态的信息需求动态分析 151
5.4 实验总结 153
5.4.1 实验小结 153
5.4.2 相关建议 153
6 研究总结与展望 154
6.1 研究总结 154
6.2 研究展望 156
参考文献 158