第一章 信息检索的基础知识 1
第一节 信息检索概述 1
第二节 计算机信息检索系统分类 14
第三节 Web搜索引擎技术 23
本章小结 27
第二章 网络信息采集 28
第一节 网络信息采集原理 28
第二节 面向主题的信息采集 30
第三节 基于Ontology的面向主题的网络信息采集算法 33
本章小节 43
本章参考文献 44
第三章 数据挖掘与信息检索 46
第一节 数据挖掘概述 46
第二节 数据挖掘与在线分析处理(OLAP) 61
第三节 数据挖掘与知识发现(KDD) 63
第四节 数据挖掘与数据仓库(Data Warehouse,DW) 63
第五节 Web挖掘 69
第六节 图像挖掘 86
本章小结 92
本章参考文献 93
第四章 网页净化(网页信息预处理) 96
第一节 网页信息预处理概述 96
第二节 几种常见的网页分块方法 97
第三节 几种网页净化方法 104
第四节 基于VIPS的净化算法 106
本章小结 111
本章参考文献 112
第五章 互联网信息的语义理解 113
第一节 语义Web的概述 113
第二节 基于中文信息获取 115
第三节 语义知识的表达及实现 116
第四节 有关知识研究的现状 119
本章参考文献 122
第六章 Web文本分类与聚类 124
第一节 文本分类概述 124
第二节 特征项选取与文本表示 124
第三节 传统的分类算法 127
第四节 基于Ontology的Web文本分类法 137
第五节 LSA的新应用——多层次分类 145
第六节 文本聚类 150
本章小结 155
本章参考文献 156
第七章 面向特定领域的智能信息搜索原型 159
第一节 面向特定领域的Spider原理及实现 159
第二节 面向特定领域的智能搜索的原型系统架构 161
第三节 面向特定领域的语义信息分析 162
第四节 领域知识的语义查询 167
本章小结 173
本章参考文献 174