第1章 绪论 1
1.1 背景介绍 1
1.1.1 目前网站建设存在的主要问题 1
1.1.2 基于网络日志的用户信息行为研究具有重要价值 2
1.1.3 网站设计与用户体验的最佳组合 4
1.2 国内外相关研究综述 5
1.2.1 基于网络日志的网站信息组织研究 5
1.2.2 基于网络日志的用户信息行为研究 7
1.3 本书内容的理论价值和现实意义 11
1.3.1 学术与理论价值 11
1.3.2 现实意义 12
1.4 本书采用的技术路线和方法 13
1.4.1 技术路线 13
1.4.2 主要方法 15
1.5 本书的主要内容 16
1.6 本书的创新点 17
第2章 网站信息组织优化与网络日志挖掘概述 18
2.1 Web技术的发展与网络日志挖掘相互促进 18
2.2 网站信息组织优化的基本内容 19
2.2.1 网站信息组织优化使网站更加智能化 19
2.2.2 网站信息组织优化的特点 19
2.2.3 网站信息组织优化的原理与机制 22
2.2.4 网络环境下信息组织优化的效率评价 23
2.2.5 网站信息组织优化系统和原型研究 25
2.2.6 网站信息组织优化的发展趋势 25
2.3 网络日志挖掘简介 26
2.3.1 网络日志数据的来源与类型 26
2.3.2 网络用户行为数据的收集方法 29
2.3.3 日志挖掘的预处理技术 35
第3章 网络用户信息行为分析 38
3.1 用户信息行为的定义 38
3.2 网络用户行为 38
3.2.1 网络用户行为的概念 38
3.2.2 网络用户行为的特征 39
3.2.3 构成网络用户行为的主要因素 41
3.3 网络用户信息行为的类型 42
3.3.1 用户的信息寻求行为 43
3.3.2 用户的信息需求行为 44
3.3.3 用户信息浏览行为 45
3.3.4 用户信息检索行为 45
3.3.5 网络用户的选择和存储行为 47
3.3.6 网络用户的信息吸收和利用行为 48
3.4 关于信息行为模型的研究 49
3.5 用户个性化知识服务需求的影响因素 52
3.5.1 个人因素 52
3.5.2 环境因素 53
3.6 基于用户信息行为的B2C网站用户认知检索模型 54
3.6.1 认知信息检索的发展及模型 55
3.6.2 用户认知信息检索的应用分析 56
3.6.3 B2C电子商务用户认知信息检索的模型 59
3.7 基于网络日志的用户行为数据的提取和分析——以某学院网站为例 61
3.7.1 网络日志的获取及其分析方法 61
3.7.2 数据分析 71
第4章 网站信息组织优化算法的设计与实现 87
4.1 智能推荐引擎的设计与实现 87
4.1.1 相似度计算 88
4.1.2 K均值算法在协作型推荐中的设计和应用 90
4.2 网站信息自动抽取技术的实现与应用 93
4.2.1 网页信息自动抽取的意义 93
4.2.2 基于重复模式识别的网页信息自动抽取 94
4.2.3 基于自然标注的网页信息抽取 101
4.3 智能预测技术的应用和实现 107
4.3.1 决策树算法模型设计 107
4.3.2 决策树算法应用于网站注册用户的预测 112
第5章 智能技术在社交网站信息过滤中的应用实例分析 115
5.1 交互性网站面临垃圾信息干扰的背景 115
5.2 贝叶斯分类器思想及其训练模型设计 116
5.2.1 贝叶斯公式 116
5.2.2 贝叶斯分类器的思想 117
5.2.3 相关研究述评 118
5.2.4 基于贝叶斯分类器的训练模型设计 119
5.3 社交网站中对垃圾信息的自动过滤 123
5.4 实验结果分析 131
5.5 结语 132
第6章 网站导航优化及其试运行效果展示 133
6.1 数据准备 135
6.2 网站组织优化试运行效果 136
6.3 结论 150
参考文献 152
后记 158