《个性化搜索引擎原理与技术》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:李树青,韩忠愿编著
  • 出 版 社:北京:科学出版社
  • 出版年份:2008
  • ISBN:9787030222558
  • 页数:125 页
图书介绍:本书通过对基于个性化信息推荐技术的搜索引擎框架和基本技术的探讨,主要介绍了利用搜索引擎服务器日志中所具有的关键词序列得到用户模式,并按照事务模式聚类的方法实现用户个性化特征的表达,最后在搜索引擎的网页索引中,利用得到的用户个性化特征改进传统的PageRank算法。通过上述工作,本书构建了一个完整的基于Web个性化信息推荐技术的搜索引擎框架结构。

第1章 绪论 1

1.1 Web信息检索 1

1.1.1 Web信息检索模型 1

1.1.2向量空间模型 2

1.1.3搜索引擎 5

1.1.4搜索引擎工作原理 7

1.1.5相关度排序技术 8

1.2 Web挖掘 11

1.2.1 Web挖掘的概念 11

1.2.2 Web挖掘的类型 12

1.2.3 Web挖掘的研究进展 15

1.3 Web个性化信息推荐服务 16

1.3.1概念 16

1.3.2 Web个性化信息推荐服务的种类划分 16

1.3.3 Web个性化信息推荐服务的发展 19

第2章 网页权重分析技术 20

2.1网页质量分析技术 20

2.1.1结合网页质量分析的Web信息检索模式 20

2.1.2网页质量测度方法 22

2.2网页相关度分析技术 27

2.2.1标准PageRank算法 27

2.2.2 PageRank的优化计算 29

第3章 个性化搜索引擎 35

3.1概念与特点 35

3.1.1现代搜索引擎系统存在的问题 35

3.1.2个性化搜索引擎的含义 36

3.1.3现阶段个性化搜索引擎的不足 37

3.2基本类型 37

3.2.1基于个性化信息采集的个性化搜索引擎 38

3.2.2基于查询改进的个性化搜索引擎 42

3.2.3基于个性化网页权重的个性化搜索引擎 43

第4章 用户个性化模式的获取和表达 49

4.1基于关键词序列的用户模式识别 49

4.1.1概述 49

4.1.2数据准备 52

4.1.3用户识别 54

4.1.4事务模式识别 56

4.2基于用户事务模式聚类的Web信息个性化表达 60

4.2.1用户事务模式的类别构造 60

4.2.2基于频繁路径的用户事务模式类别构造 68

4.2.3降维处理问题 69

第5章 基于关键词序列的个性化网页权重方法 71

5.1方法概述 71

5.2基于修改网页权重值的个性化PageRank 72

5.3基于添加修正参数的个性化PageRank 75

5.3.1使用事务聚类模式的个性化PageRank方法 76

5.3.2使用主题化事务聚类模式的个性化PageRank方法 77

第6章 系统原型的实现 81

6.1系统的开发方式 81

6.2数据结构 81

6.3存储过程 84

6.4系统的功能模块 91

6.4.1爬虫模块 91

6.4.2 Web网页分析模块 102

6.4.3日志分析模块 102

6.4.4用户接口模块 103

6.5结果分析 109

6.5.1关键词访问序列的获取情况 109

6.5.2用户事务模式的获取情况 110

6.5.3用户事务模式的聚类情况 111

6.5.4个性化PageRank值的计算情况 113

6.6系统框架评价 116

参考文献 118