《基于检索结果聚类的XML伪反馈技术研究》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:钟敏娟著
  • 出 版 社:南昌:江西高校出版社
  • 出版年份:2013
  • ISBN:9787549322503
  • 页数:177 页
图书介绍:XML作为一种新兴的数据格式,如何对它进行有效查询和检索,近几年来一直是数据库和信息检索领域关注的前沿研究课题。本书针对XML伪反馈技术中存在的查询主题漂移现象进行了深入的研究,并提出了有效地解决思路,这些为最终提高XML信息检索的查询性能以及整个搜索引擎的查询质量提供了一个很好的基础以及可借鉴的技术方案。

1.引言 1

1.1 研究背景与意义 1

1.2 国内外研究现状概述 3

1.3 本书的研究思路与主要研究内容 9

1.4 结构安排 10

2.XML信息检索与反馈技术 12

2.1 传统信息检索模型与性能评价 12

2.1.1 信息检索模型 12

2.1.2 检索性能评价 19

2.2 基于反馈的信息检索 23

2.2.1 相关反馈 23

2.2.2 伪反馈 26

2.2.3 隐式反馈 29

2.3 XML 30

2.3.1 XML概述 30

2.3.2 XML文档的特点 31

2.3.3 XML查询模型 35

2.4 INEX 评测 37

2.4.1 INEX测试集 38

2.4.2 Indri搜索引擎 41

2.5 本章小结 44

3.XML检索结果聚类 45

3.1 问题的提出 45

3.2 研究现状 46

3.3 以文档为返回粒度的XML检索结果聚类 49

3.3.1 动机 50

3.3.2 带结构语义的扩展向量空间模型 53

3.3.4 初始中心点的优化算法 59

3.3.5 实验评测 60

3.4 以元素节点为返回粒度的XML检索结果聚类 70

3.4.1 隐含语义索引模型 71

3.4.2 基于词项语义的相似性度量 73

3.4.3 基于评价函数的k-medoid簇数优化 76

3.4.4 实验分析与评价 78

3.5 本章小结 85

4.基于聚类的XML高质量反馈文档的排序 88

4.1 问题的提出 88

4.2 研究现状 89

4.3 面向文档粒度的相关文档查找 91

4.3.1 基于均衡化权值的簇标签提取 91

4.3.2 簇标签中心词项权值计算 93

4.3.3 候选簇的排序模型 94

4.3.4 基于候选簇的文档排序模型 95

4.3.5 实验结果与分析 97

4.4 面向元素节点粒度的相关反馈文档片段查找 109

4.4.1 基于簇标签的候选簇的排序模型 110

4.4.2 基于候选簇的文档片段排序模型 112

4.4.3 实验评价与分析 113

4.5 本章小结 125

5.XML查询扩展 127

5.1 问题的提出 127

5.2 研究现状 128

5.3 XML查询扩展 132

5.3.1 基于伪反馈的关键词扩展 132

5.3.2 基于伪反馈的结构扩展 133

5.4 实验结果与分析 134

5.4.1 实验准备 134

5.4.2 实验评价与分析 135

5.5 本章小结 155

6.结论与展望 157

参考文献 161

致谢 176