第1章 绪论 1
1.1 Web信息检索 1
1.1.1 Web信息检索模型 1
1.1.2向量空间模型 2
1.1.3搜索引擎 5
1.1.4搜索引擎工作原理 7
1.1.5相关度排序技术 8
1.2 Web挖掘 11
1.2.1 Web挖掘的概念 11
1.2.2 Web挖掘的类型 12
1.2.3 Web挖掘的研究进展 15
1.3 Web个性化信息推荐服务 16
1.3.1概念 16
1.3.2 Web个性化信息推荐服务的种类划分 16
1.3.3 Web个性化信息推荐服务的发展 19
第2章 网页权重分析技术 20
2.1网页质量分析技术 20
2.1.1结合网页质量分析的Web信息检索模式 20
2.1.2网页质量测度方法 22
2.2网页相关度分析技术 27
2.2.1标准PageRank算法 27
2.2.2 PageRank的优化计算 29
第3章 个性化搜索引擎 35
3.1概念与特点 35
3.1.1现代搜索引擎系统存在的问题 35
3.1.2个性化搜索引擎的含义 36
3.1.3现阶段个性化搜索引擎的不足 37
3.2基本类型 37
3.2.1基于个性化信息采集的个性化搜索引擎 38
3.2.2基于查询改进的个性化搜索引擎 42
3.2.3基于个性化网页权重的个性化搜索引擎 43
第4章 用户个性化模式的获取和表达 49
4.1基于关键词序列的用户模式识别 49
4.1.1概述 49
4.1.2数据准备 52
4.1.3用户识别 54
4.1.4事务模式识别 56
4.2基于用户事务模式聚类的Web信息个性化表达 60
4.2.1用户事务模式的类别构造 60
4.2.2基于频繁路径的用户事务模式类别构造 68
4.2.3降维处理问题 69
第5章 基于关键词序列的个性化网页权重方法 71
5.1方法概述 71
5.2基于修改网页权重值的个性化PageRank 72
5.3基于添加修正参数的个性化PageRank 75
5.3.1使用事务聚类模式的个性化PageRank方法 76
5.3.2使用主题化事务聚类模式的个性化PageRank方法 77
第6章 系统原型的实现 81
6.1系统的开发方式 81
6.2数据结构 81
6.3存储过程 84
6.4系统的功能模块 91
6.4.1爬虫模块 91
6.4.2 Web网页分析模块 102
6.4.3日志分析模块 102
6.4.4用户接口模块 103
6.5结果分析 109
6.5.1关键词访问序列的获取情况 109
6.5.2用户事务模式的获取情况 110
6.5.3用户事务模式的聚类情况 111
6.5.4个性化PageRank值的计算情况 113
6.6系统框架评价 116
参考文献 118