第1章 信息检索及其主要研究内容 1
1.1 信息检索 3
1.1.1 信息检索的基本概念 3
1.1.2 信息检索的研究内容 3
1.1.3 研究现状和发展趋势 4
1.1.4 结构化、半结构化和非结构化信息 5
1.2 大数据背景下的信息检索 6
参考文献 7
第2章 信息检索的需求表达 11
2.1 需求表达 13
2.2 需求表达的主要理论方法 13
2.3 需求表达存在的主要问题分析 14
2.4 信息需求域 15
2.4.1 机器信息检索:用关键词匹配近似语义匹配 15
2.4.2 文档、句子及词语之间的语义关系 15
2.4.3 信息需求域 18
2.4.4 信息需求域的理论推导 22
2.4.5 信息需求域的子域、近似域 24
2.4.6 查询请求与信息需求的关系 26
2.4.7 信息需求域的理论意义 29
2.4.8 信息需求域的一种粗糙集解释 29
2.5 小结与讨论 33
参考文献 34
第3章 信息检索的检索模型 37
3.1 信息检索的主要检索模型 39
3.2 查询扩展、相关反馈研究现状 42
3.3 检索存在的主要问题分析 43
3.4 信息需求域基础上的信息检索 45
3.4.1 信息需求域的结构 45
3.4.2 文档相似度的定义 50
3.5 检索模型的发展方向分析 59
参考文献 60
第4章 文档索引的建立 67
4.1 附加统计信息的倒排索引 69
4.2 停用词 71
4.3 词干提取 71
4.4 词形归并 72
4.5 小结与讨论 73
参考文献 73
第5章 信息检索系统的评价方法 75
5.1 测试集 77
5.2 无序检索结果的评价 79
5.3 排序检索结果的评价 80
5.4 小结与讨论 82
参考文献 82
第6章 伪相关文档反馈需求域模型信息检索 85
6.1 伪相关文档反馈机制 87
6.2 需求域去噪 87
6.3 伪相关文档反馈机制的模型分析 89
6.3.1 去噪性能分析与实验 91
6.3.2 去噪参数β的取值分析与实验 95
6.3.3 参数α的取值分析与实验 99
6.3.4 伪相关反馈文档数目及稳定性分析与实验 101
6.4 伪相关文档反馈机制下的需求域模型结论 103
6.4.1 需求域模型结论 104
6.4.2 检索性能对比实验分析 106
6.5 小结与讨论 111
参考文献 112
本章附录 112
第7章 用户相关文档反馈需求域模型信息检索 117
7.1 用户相关文档反馈机制 119
7.2 用户相关文档反馈机制下的模型分析 120
7.2.1 用户相关文档反馈下的上界优化分析与实验 121
7.2.2 优化参数β的取值分析与实验 124
7.2.3 参数α的取值分析与实验 127
7.2.4 相关反馈文档数目及稳定性的分析与实验 130
7.3 用户相关文档反馈机制下的需求域模型结论 133
7.3.1 需求域模型结论 133
7.3.2 检索性能对比实验分析 135
7.4 需求域模型计算性能分析 139
7.5 小结与讨论 140
全书参考文献 143