《基于潜在语义的个性化搜索关键技术研究》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:陈冬玲著
  • 出 版 社:北京:中国水利水电出版社
  • 出版年份:2013
  • ISBN:9787517010319
  • 页数:142 页
图书介绍:随着网络技术的飞速发展,信息爆炸所产生的个人信息疲劳和信息压力使搜索引擎变得越来越重要,搜索引擎已经成为名副其实的信息枢纽和信息门户,是用户获取网络信息的首选工具。本文从用户潜在语义动机的理解出发,针对个性化搜索各个环节中的关键技术展开研究,如用户建模技术、查询扩展技术、网页局部优化排序技术、聚类技术等,力求达到用户查询与搜索引擎返回结果的高效匹配。

第1章 绪论 1

1.1 搜索引擎体系结构及功能 1

1.1.1 信息的收集 2

1.1.2 信息预处理 2

1.1.3 查询服务 2

1.2 个性化搜索引擎 2

1.2.1 个性化搜索引擎的体系结构 2

1.2.2 个性化搜索关键技术 4

1.2.3 个性化搜索研究现状 9

1.2.4 个性化搜索面临的问题与挑战 16

1.3 本文研究的主要内容 18

1.4 本文的组织结构 20

第2章 基于概率潜在语义的用户模型构造 21

2.1 问题提出 21

2.2 用户模型研究综述 23

2.2.1 用户模型的创建技术研究 23

2.2.2 用户模型的学习与更新技术研究 27

2.2.3 用户模型应用技术的研究 29

2.3 用户搜索行为的理论分析 29

2.3.1 从认知角度分析用户的搜索行为 29

2.3.2 用户搜索行为的不确定性 33

2.3.3 用户搜索行为分析的逻辑框架 34

2.4 用户动机分析的两类不确定问题 36

2.5 基于PLSA的潜在概念获取与用户模型构建 37

2.5.1 概率潜在语义分析 37

2.5.2 潜在语义空间的Zipf分布 38

2.5.3 基于PLSA的用户动机建模 39

2.5.4 用户模型的学习与更新 43

2.6 实验及评价 45

2.6.1 数据集 45

2.6.2 评价标准 47

2.6.3 实验结果及分析 48

2.7 本章小结 51

第3章 基于有限混合模型的文本聚类 53

3.1 问题提出 53

3.2 传统聚类算法的概述 54

3.2.1 基于相似性的聚类方法 55

3.2.2 基于模型的聚类 58

3.2.3 各类算法的对比分析 59

3.3 传统聚类方式在个性化搜索中存在的问题 60

3.4 基于有限混合主题模型的文档聚类分析 62

3.4.1 有限混合模型 62

3.4.2 EM算法 63

3.4.3 基于有限混合模型的文档聚类 68

3.5 实验及评价 73

3.5.1 实验数据集 73

3.5.2 评价标准 74

3.5.3 实验结果及分析 74

3.6 本章小结 78

第4章 基于用户潜在语义动机的查询扩展 79

4.1 问题提出 79

4.2 现有的查询扩展方法概述 80

4.2.1 基于大规模语料库的查询扩展方法 80

4.2.2 基于语义关系/语义结构的查询扩展方法 84

4.3 目前查询扩展方法的不足 87

4.4 基于潜在语义动机的查询扩展 88

4.4.1 ULSM-QE的框架 88

4.4.2 查询词处理 90

4.4.3 查询语义动机分析 90

4.4.4 相关度计算 94

4.4.5 查询词的语义消歧 95

4.4.6 生成新查询 98

4.5 实验及评价 101

4.5.1 数据集 101

4.5.2 评价标准 102

4.5.3 实验结果及分析 103

4.6 本章小结 109

第5章 基于用户偏好的网页排序局部优化策略 110

5.1 问题提出 110

5.2 传统网页排序算法介绍 111

5.2.1 PageRank算法及其衍生算法 111

5.2.2 HITS算法 113

5.3 传统排序算法存在的问题 114

5.4 基于用户偏好的网页排序 116

5.4.1 UP-PR框架 117

5.4.2 查询词的主题分类 119

5.4.3 网页的主题分类 120

5.4.4 参数的选择 122

5.5 实验及评价 123

5.5.1 数据集 123

5.5.2 评价标准 124

5.5.3 实验结果及分析 124

5.6 本章小结 128

第6章 结论 129

6.1 本文的主要贡献与结论 129

6.2 进一步的工作 130

参考文献 132

作者简介 142