第一部分 基础知识 2
第1章 简介 2
1.1 面向网络应用的推荐系统概述 3
1.1.1 算法 3
1.1.2 优化指标 5
1.1.3 探索与利用之间的权衡 5
1.1.4 推荐系统的评估 5
1.1.5 推荐和搜索:推送与拉取 6
1.2 一个简单的评分模型:热门推荐 7
1.3 练习 10
第2章 经典推荐方法 11
2.1 物品特征 11
2.1.1 分类 12
2.1.2 词袋模型 13
2.1.3 主题建模 15
2.1.4 其他物品特征 16
2.2 用户特征 16
2.2.1 声明的个人信息 17
2.2.2 基于内容的画像 17
2.2.3 其他用户特征 18
2.3 基于特征的方法 18
2.3.1 无监督方法 18
2.3.2 有监督方法 19
2.3.3 上下文信息 22
2.4 协同过滤 22
2.4.1 基于用户-用户相似度的方法 23
2.4.2 基于物品-物品相似度的方法 24
2.4.3 矩阵分解 24
2.5 混合方法 27
2.6 小结 28
2.7 练习 28
第3章 面向推荐问题的探索与利用 29
3.1 探索与利用之间的权衡简介 30
3.2 多臂赌博机问题 31
3.2.1 贝叶斯方法 31
3.2.2 极小化极大方法 34
3.2.3 启发式赌博方案 35
3.2.4 方法评价 36
3.3 推荐系统中的探索与利用 36
3.3.1 热门推荐 36
3.3.2 个性化推荐 36
3.3.3 数据稀疏性的挑战 37
3.4 处理数据稀疏性的探索与利用 37
3.4.1 降维方法 37
3.4.2 降维中的探索与利用 39
3.4.3 在线模型 39
3.5 小结 40
3.6 练习 40
第4章 评估方法 41
4.1 传统的离线评估方法 41
4.1.1 数据划分方法 42
4.1.2 准确度指标 44
4.1.3 排序指标 45
4.2 在线分桶测试 49
4.2.1 设置分桶测试 49
4.2.2 在线性能指标 50
4.2.3 测试结果分析 51
4.3 离线模拟 52
4.4 离线回放 54
4.4.1 基本回放估计 55
4.4.2 回放的扩展 57
4.5 小结 58
4.6 练习 58
第二部分 常见问题设置 60
第5章 问题设置与系统架构 60
5.1 问题设置 60
5.1.1 常见的推荐模块 60
5.1.2 应用设置 63
5.1.3 常见的统计方法 65
5.2 系统架构 66
5.2.1 主要组件 66
5.2.2 示例系统 67
第6章 热门推荐 69
6.1 应用案例:雅虎“今日”模块 69
6.2 问题定义 71
6.3 贝叶斯方案 72
6.3.1 2×2案例:两件物品,两个间隔 73
6.3.2 K×2案例:K件物品,两个间隔 75
6.3.3 一般解 77
6.4 非贝叶斯方案 79
6.5 实验评估 81
6.5.1 比较分析 81
6.5.2 方案刻画 83
6.5.3 分段分析 85
6.5.4 桶测试结果 86
6.6 大规模内容池 87
6.7 小结 87
6.8 练习 88
第7章 基于特征回归的个性化 89
7.1 快速在线双线性因子模型 90
7.1.1 FOBFM概述 90
7.1.2 FOBFM详解 91
7.2 离线训练 93
7.2.1 EM算法 94
7.2.2 E步骤 95
7.2.3 M步骤 96
7.2.4 可扩展性 97
7.3 在线学习 97
7.3.1 在线高斯模型 97
7.3.2 在线逻辑模型 98
7.3.3 探索与利用方案 99
7.3.4 在线模型选择 99
7.4 雅虎数据集上的效果展示 100
7.4.1 My Yahoo!数据集 101
7.4.2 雅虎首页数据集 103
7.4.3 不包含离线双线性项的FOBFM 105
7.5 小结 105
7.6 练习 106
第8章 基于因子模型的个性化 107
8.1 面向回归的隐因子模型 107
8.1.1 从矩阵分解到RLFM 108
8.1.2 模型详解 109
8.1.3 RLFM的随机过程 112
8.2 拟合算法 113
8.2.1 适用于高斯响应的EM算法 114
8.2.2 适用于逻辑响应的基于ARS的EM算法 118
8.2.3 适用于逻辑响应的变分EM算法 121
8.3 冷启动效果展示 124
8.4 时间敏感物品的大规模推荐 127
8.4.1 在线学习 127
8.4.2 并行拟合算法 128
8.5 大规模问题效果展示 130
8.5.1 MovieLens-1M数据 131
8.5.2 小规模雅虎首页数据 132
8.5.3 大规模雅虎首页数据 134
8.5.4 结果讨论 137
8.6 小结 138
8.7 练习 138
第三部分 进阶主题 140
第9章 基于隐含狄利克雷分布的分解 140
9.1 简介 140
9.2 模型 141
9.2.1 模型概述 141
9.2.2 模型详解 142
9.3 训练和预测 145
9.3.1 模型拟合 145
9.3.2 预测 150
9.4 实验 150
9.4.1 MovieLens数据 150
9.4.2 Yahoo!Buzz应用 151
9.4.3 BookCrossing数据集 153
9.5 相关工作 154
9.6 小结 155
第10章 上下文相关推荐 156
10.1 张量分解模型 157
10.1.1 建模 157
10.1.2 模型拟合 158
10.1.3 讨论 159
10.2 层次收缩模型 160
10.2.1 建模 160
10.2.2 模型拟合 161
10.2.3 局部增强张量模型 164
10.3 多角度新闻文章推荐 165
10.3.1 探索性数据分析 166
10.3.2 实验评估 171
10.4 相关物品推荐 176
10.4.1 语义相关性 177
10.4.2 响应预测 177
10.4.3 预测响应和预测相关性的结合 178
10.5 小结 178
第11章 多目标优化 179
11.1 应用设置 179
11.2 分段方法 180
11.2.1 问题设置 180
11.2.2 目标优化 181
11.3 个性化方法 183
11.3.1 原始表示 184
11.3.2 拉格朗日对偶 185
11.4 近似方法 188
11.4.1 聚类 188
11.4.2 采样 189
11.5 实验 189
11.5.1 实验设置 190
11.5.2 实验结果 191
11.6 相关工作 197
11.7 小结 198
参考文献 199
索引 205