计算机科学丛书 统计推荐系统PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:(美国)迪帕克·K.阿加瓦尔,陈必衷
- 出 版 社:北京:机械工业出版社
- 出版年份:2019
- ISBN:9787111635734
- 页数:220 页
第一部分 基础知识 2
第1章 简介 2
1.1 面向网络应用的推荐系统概述 3
1.1.1 算法 3
1.1.2 优化指标 5
1.1.3 探索与利用之间的权衡 5
1.1.4 推荐系统的评估 5
1.1.5 推荐和搜索:推送与拉取 6
1.2 一个简单的评分模型:热门推荐 7
1.3 练习 10
第2章 经典推荐方法 11
2.1 物品特征 11
2.1.1 分类 12
2.1.2 词袋模型 13
2.1.3 主题建模 15
2.1.4 其他物品特征 16
2.2 用户特征 16
2.2.1 声明的个人信息 17
2.2.2 基于内容的画像 17
2.2.3 其他用户特征 18
2.3 基于特征的方法 18
2.3.1 无监督方法 18
2.3.2 有监督方法 19
2.3.3 上下文信息 22
2.4 协同过滤 22
2.4.1 基于用户-用户相似度的方法 23
2.4.2 基于物品-物品相似度的方法 24
2.4.3 矩阵分解 24
2.5 混合方法 27
2.6 小结 28
2.7 练习 28
第3章 面向推荐问题的探索与利用 29
3.1 探索与利用之间的权衡简介 30
3.2 多臂赌博机问题 31
3.2.1 贝叶斯方法 31
3.2.2 极小化极大方法 34
3.2.3 启发式赌博方案 35
3.2.4 方法评价 36
3.3 推荐系统中的探索与利用 36
3.3.1 热门推荐 36
3.3.2 个性化推荐 36
3.3.3 数据稀疏性的挑战 37
3.4 处理数据稀疏性的探索与利用 37
3.4.1 降维方法 37
3.4.2 降维中的探索与利用 39
3.4.3 在线模型 39
3.5 小结 40
3.6 练习 40
第4章 评估方法 41
4.1 传统的离线评估方法 41
4.1.1 数据划分方法 42
4.1.2 准确度指标 44
4.1.3 排序指标 45
4.2 在线分桶测试 49
4.2.1 设置分桶测试 49
4.2.2 在线性能指标 50
4.2.3 测试结果分析 51
4.3 离线模拟 52
4.4 离线回放 54
4.4.1 基本回放估计 55
4.4.2 回放的扩展 57
4.5 小结 58
4.6 练习 58
第二部分 常见问题设置 60
第5章 问题设置与系统架构 60
5.1 问题设置 60
5.1.1 常见的推荐模块 60
5.1.2 应用设置 63
5.1.3 常见的统计方法 65
5.2 系统架构 66
5.2.1 主要组件 66
5.2.2 示例系统 67
第6章 热门推荐 69
6.1 应用案例:雅虎“今日”模块 69
6.2 问题定义 71
6.3 贝叶斯方案 72
6.3.1 2×2案例:两件物品,两个间隔 73
6.3.2 K×2案例:K件物品,两个间隔 75
6.3.3 一般解 77
6.4 非贝叶斯方案 79
6.5 实验评估 81
6.5.1 比较分析 81
6.5.2 方案刻画 83
6.5.3 分段分析 85
6.5.4 桶测试结果 86
6.6 大规模内容池 87
6.7 小结 87
6.8 练习 88
第7章 基于特征回归的个性化 89
7.1 快速在线双线性因子模型 90
7.1.1 FOBFM概述 90
7.1.2 FOBFM详解 91
7.2 离线训练 93
7.2.1 EM算法 94
7.2.2 E步骤 95
7.2.3 M步骤 96
7.2.4 可扩展性 97
7.3 在线学习 97
7.3.1 在线高斯模型 97
7.3.2 在线逻辑模型 98
7.3.3 探索与利用方案 99
7.3.4 在线模型选择 99
7.4 雅虎数据集上的效果展示 100
7.4.1 My Yahoo!数据集 101
7.4.2 雅虎首页数据集 103
7.4.3 不包含离线双线性项的FOBFM 105
7.5 小结 105
7.6 练习 106
第8章 基于因子模型的个性化 107
8.1 面向回归的隐因子模型 107
8.1.1 从矩阵分解到RLFM 108
8.1.2 模型详解 109
8.1.3 RLFM的随机过程 112
8.2 拟合算法 113
8.2.1 适用于高斯响应的EM算法 114
8.2.2 适用于逻辑响应的基于ARS的EM算法 118
8.2.3 适用于逻辑响应的变分EM算法 121
8.3 冷启动效果展示 124
8.4 时间敏感物品的大规模推荐 127
8.4.1 在线学习 127
8.4.2 并行拟合算法 128
8.5 大规模问题效果展示 130
8.5.1 MovieLens-1M数据 131
8.5.2 小规模雅虎首页数据 132
8.5.3 大规模雅虎首页数据 134
8.5.4 结果讨论 137
8.6 小结 138
8.7 练习 138
第三部分 进阶主题 140
第9章 基于隐含狄利克雷分布的分解 140
9.1 简介 140
9.2 模型 141
9.2.1 模型概述 141
9.2.2 模型详解 142
9.3 训练和预测 145
9.3.1 模型拟合 145
9.3.2 预测 150
9.4 实验 150
9.4.1 MovieLens数据 150
9.4.2 Yahoo!Buzz应用 151
9.4.3 BookCrossing数据集 153
9.5 相关工作 154
9.6 小结 155
第10章 上下文相关推荐 156
10.1 张量分解模型 157
10.1.1 建模 157
10.1.2 模型拟合 158
10.1.3 讨论 159
10.2 层次收缩模型 160
10.2.1 建模 160
10.2.2 模型拟合 161
10.2.3 局部增强张量模型 164
10.3 多角度新闻文章推荐 165
10.3.1 探索性数据分析 166
10.3.2 实验评估 171
10.4 相关物品推荐 176
10.4.1 语义相关性 177
10.4.2 响应预测 177
10.4.3 预测响应和预测相关性的结合 178
10.5 小结 178
第11章 多目标优化 179
11.1 应用设置 179
11.2 分段方法 180
11.2.1 问题设置 180
11.2.2 目标优化 181
11.3 个性化方法 183
11.3.1 原始表示 184
11.3.2 拉格朗日对偶 185
11.4 近似方法 188
11.4.1 聚类 188
11.4.2 采样 189
11.5 实验 189
11.5.1 实验设置 190
11.5.2 实验结果 191
11.6 相关工作 197
11.7 小结 198
参考文献 199
索引 205
- 《建筑施工企业统计》杨淑芝主编 2008
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《新编历史小丛书 祖逖北伐》何兹全著 2019
- 《国际经典影像诊断学丛书 消化影像诊断学 原著第3版》王振常,蒋涛,李宏军,杨正汉译;(美)迈克尔·P.费德勒 2019
- 《计算机辅助平面设计》吴轶博主编 2019
- 《本草古籍辑注丛书 第1辑 《食疗本草》辑校》(唐)孟诜撰;(唐)张鼎增补;尚志钧辑校 2019
- 《计算机组成原理解题参考 第7版》张基温 2017
- 《云计算节能与资源调度》彭俊杰主编 2019
- 《反常识》张娟责任编辑;(美国)邓肯·J.瓦茨 2019
- 《手工咖啡 咖啡爱好者的完美冲煮指南》(美国)杰茜卡·伊斯托,安德烈亚斯·威尔霍夫 2019
- 《本雅明档案》德国瓦尔特·本雅明档案馆编 2018
- 《评弹与江南社会研究丛书 梅与竹 中国传统苏州评弹》李东鹏译;(美国)马克·本德尔 2019
- 《标准急救护理速查手册 普及版》美国骨科医师协会 (AAOS) ,美国急诊医师学会 (ACEP) 主编 2018
- 《搏击俱乐部》千之贺译;(美国)查克·帕拉尼克,卡梅隆·斯图尔特 2019
- 《DK医学史》李虎译;(英国)史蒂夫·帕克 2019
- 《林中的陌生人 最后一位隐士》何家炜责任编辑;(美国)迈克·芬克尔 2019
- 《解决数学问题》美国迪斯尼公司著 2012
- 《超级思维》任烨译;(美国)托马斯·W.马隆 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019