第1章 绪论 1
搜索引擎的概念 2
搜索引擎的分类 2
搜索引擎的发展现状 5
搜索引擎的发展趋势 6
第2章 Web搜索引擎的工作原理 9
搜索引擎的基本要求 9
爬虫 13
预处理 14
查询服务 17
第3章 数据预处理 22
数据源 22
Web文本信息提取 22
去噪 26
分词 27
特征提取 27
文档表示 29
降维 30
第4章 Web信息查询系统 32
查询系统的结构 32
检索的定义 33
查询系统的实现 34
第5章 自动分词技术 38
引言 38
中文自动分词方法 39
自动分词词典机制 50
歧义字段自动识别技术 70
命名实体自动识别技术 77
第6章 面向专题的信息搜集和处理 95
专题搜索引擎的构建 95
专题搜索引擎的文本自动分类和专题分词技术 108
基于向量空间模型的文本聚类 122
第7章 基于Agent的智能搜索引擎技术 136
Agent与Multi-Agent技术 136
Agent技术在信息检索中的应用 147
Agent实现技术 149
Agent与智能信息检索 150
基于Agent的个性化信息检索系统 154
参考文献 175