第1章 绪论 1
1.1研究目的及意义 1
1.2主要内容及基本结构 3
1.3组织结构 5
第2章 相关研究工作概述 6
2.1传统信息检索方法 6
2.2基于语言模型的检索方法 9
2.2.1查询使然排序 9
2.2.2相对熵排序 11
2.3基于语义增强的检索方法 12
2.3.1查询扩展 12
2.3.2相关性反馈 14
2.3.3主题模型 17
2.3.4概念模型 19
2.3.5文档扩展 19
2.4基于排序学习的检索方法 20
2.5中文文本索引方法 23
2.6检索模型的评价方法 25
2.7文本的概念自动标注方法 26
第3章 文本的概念标注方法 29
3.1引言 29
3.2基于领域辞典中概念的方法 30
3.3基于维基百科概念的方法 31
3.3.1维基百科概念库的构建 31
3.3.2基于排序学习的概念标注方法 33
3.3.3特征集 35
3.3.4实验配置 36
3.3.5实验结果分析 38
3.4基于自动抽取概念的方法 41
3.5本章小结 42
第4章 概念的语义表征模型 44
4.1引言 44
4.2领域辞典中概念的表征 44
4.3维基百科概念的表征 47
4.3.1基于混合模型的方法 47
4.3.2基于互信息的方法 50
4.4概念间的语义相关度计算 52
4.5本章小结 53
第5章 基于概念的文档平滑方法 54
5.1引言 54
5.2基于概念的文档表征方法 54
5.2.1基于领域辞典中概念的方法 54
5.2.2基于维基百科概念的方法 55
5.3文档的语义平滑模型 57
5.4专业领域文档集的实验 59
5.4.1实验配置 59
5.4.2和传统方法的比较 60
5.4.3不同平滑参数的比较 61
5.5新闻文档集的实验 63
5.5.1实验配置 63
5.5.2和传统模型的比较 64
5.5.3不同平滑参数的比较 67
5.5.4不同概念数的比较 68
5.5.5和其他概念表征方法的比较 68
5.5.6和其他概念标注方法的比较 69
5.5.7和其他文档平滑方法的比较 72
5.6本章小结 73
第6章 基于概念的查询平滑方法 74
6.1引言 74
6.2基于概念的查询表征方法 75
6.2.1基于伪相关反馈的方法 75
6.2.2基于交互式选择的方法 75
6.3查询的语义平滑模型 77
6.4专业领域文档集的实验分析 79
6.4.1实验配置 79
6.4.2和相关性模型的比较 80
6.4.3不同平滑参数的比较 82
6.4.4联合平滑实验 82
6.5新闻文档集的实验分析 85
6.5.1实验配置 85
6.5.2和相关性模型的比较 86
6.5.3不同平滑参数的比较 88
6.5.4和其他语义平滑方法的比较 88
6.5.5和自动概念标注方法的比较 90
6.5.6联合平滑实验 91
6.6本章小结 92
第7章 基于概念相关度的中文检索模型 93
7.1引言 93
7.2检索模型 94
7.2.1查询-文档相关度计算 94
7.2.2基于排序学习的方法 94
7.2.3特征集 96
7.3实验配置 97
7.3.1语料集 97
7.3.2训练样本分组 98
7.3.3特征归一化处理 98
7.4实验结果分析 99
7.4.1和传统模型的比较 99
7.4.2和使用部分特征集方法的比较 100
7.5本章小结 100
第8章 结论与展望 102
8.1结论 102
8.2展望 104
参考文献 106