第1章Internet搜索引擎概述 1
1.1Internet搜索引擎简介 2
1.2Internet搜索引擎的基本原理 6
1.3Internet搜索引擎的相关技术 8
1.3.1网络信息收集 8
1.3.2网络信息索引 9
1.3.3网络信息检索 12
1.3.4网页重要性评价技术 18
1.3.5自动分类技术 20
1.3.6个性化技术 24
1.4本书研究背景及内容 27
1.4.1本书研究背景 27
1.4.2本书研究内容 30
第2章Internet主题搜索引擎的总体设计 33
2.1 Internet主题搜索引擎概述 33
2.2 Internet主题搜索引擎的目标 34
2.3 Internet主题搜索引擎的总体设计 35
2.4 Internet主题搜索引擎的基本模块 38
2.4.1爬行 38
2.4.2索引 39
2.4.3检索 39
2.4.4排序 41
2.4.5自动分类 41
2.4.6个性化检索 42
2.5本章小结 43
第3章Internet主题搜索引擎的信息收集和索引 45
3.1 Internet主题搜索引擎的收集策略 45
3.1.1爬行器的基本概念 45
3.1.2爬行器的访问策略 45
3.1.3主题搜索引擎爬行器的设计和实现 47
3.2 Internet主题搜索引擎的索引策略 48
3.2.1索引器的基本概念 48
3.2.2主题搜索引擎索引器的设计和实现 49
3.3本章小结 50
第4章Internet主题搜索引擎的检索和排序 51
4.1基于倒排索引的关键词检索 51
4.1.1检索策略 51
4.1.2检索的基本功能和实现 53
4.2基于网络链接结构的网页评价和排序 57
4.2.1 PageRank算法的实现 57
4.2.2基本排序方法 58
4.3 Internet主题搜索引擎的基本检索功能和相关界面 60
4.3.1基本检索 60
4.3.2使用偏好设置 60
4.3.3高级检索 62
4.3.4结果显示 64
4.4本章小结 66
第5章 专业信息的自动分类 67
5.1自动分类算法的研究 67
5.1.1自动分类算法 68
5.1.2特征词提取方法 72
5.1.3自动分类的评价标准 75
5.1.4自动分类算法的比较 77
5.2专业网络信息的中英文自动分类 80
5.2.1专业词典 81
5.2.2网页编码方式的检测和整合 82
5.2.3基于专业词典的中英文自动分类方法 84
5.2.4数据集及评价标准 87
5.2.5测试结果及分析 91
5.3 Internet主题搜索引擎中专业信息的中英文自动分类 109
5.3.1网页资源的自动分类 111
5.3.2分类结果和检索结果的整合 113
5.3.3分类结果显示界面 113
5.4本章小结 115
第6章Internet主题搜索引擎的个性化检索 117
6.1个性化检索概述 117
6.1.1用户兴趣信息的收集 118
6.1.2用户兴趣模型的建立 118
6.1.3用户兴趣模型的使用 119
6.1.4个性化检索的评价 120
6.2基于用户兴趣模型的个性化检索策略 122
6.2.1用户个性化信息的收集 122
6.2.2用户兴趣模型的建立 124
6.3 Internet主题搜索引擎的个性化检索 126
6.4本章小结 128
第7章Internet主题搜索引擎的展望 129
附录A英文停用词表 131
附录B Reuters-21578数据集的分类体系 135
附录C化学学科分类体系 136
附录D ChemEngine的查询语法规则 153
参考文献 155
后记 167