第1章 推荐系统:简介和挑战 1
1.1 简介 1
1.2 推荐系统的功能 3
1.3 数据和知识来源 5
1.4 推荐技术 7
1.5 推荐系统评估 10
1.6 推荐系统应用 11
1.7 推荐系统与人机交互 13
1.8 高级话题 14
1.9 挑战 16
1.9.1 偏好获取与分析 16
1.9.2 交互 17
1.9.3 新的推荐任务 18
参考文献 19
第一部分 推荐系统技术 24
第2章 基于邻域的推荐方法综述 24
2.1 简介 24
2.1.1 基于邻域方法的优势 25
2.1.2 目标和概要 26
2.2 问题定义和符号 26
2.3 基于邻域的推荐 27
2.3.1 基于用户的评分预测 28
2.3.2 基于用户的分类预测方法 28
2.3.3 回归与分类 29
2.3.4 基于物品的推荐 29
2.3.5 基于用户和基于物品的推荐方法的比较 30
2.4 基于邻域方法的要素 31
2.4.1 评分标准化 31
2.4.2 相似度权重的计算 33
2.4.3 邻域的选择 37
2.5 高级进阶技术 37
2.5.1 基于图的方法 38
2.5.2 基于学习的方法 40
2.6 总结 44
参考文献 44
第3章 协同过滤方法进阶 48
3.1 简介 48
3.2 预备知识 49
3.2.1 基准预测 49
3.2.2 Netflix数据 50
3.2.3 隐式反馈 51
3.3 矩阵分解模型 51
3.3.1 SVD 52
3.3.2 SVD++ 53
3.3.3 时间敏感的因子模型 54
3.3.4 比较 57
3.3.5 小结 58
3.4 基于邻域的模型 59
3.4.1 相似度度量 59
3.4.2 基于相似度的插值 60
3.4.3 联合派生插值权重 61
3.4.4 小结 63
3.5 增强的基于邻域的模型 63
3.5.1 全局化的邻域模型 64
3.5.2 因式分解的邻域模型 67
3.5.3 基于邻域模型的动态时序 71
3.5.4 小结 72
3.6 基于邻域的模型和因子分解模型的比较 73
参考文献 75
第4章 基于内容的语义感知推荐系统 77
4.1 简介 77
4.2 基于内容的推荐系统概述 77
4.2.1 基于关键词的向量空间模型 79
4.2.2 用户特征学习的方法 80
4.2.3 基于内容过滤的优缺点 81
4.3 自上而下的语义方法 82
4.3.1 基于本体资源的方法 83
4.3.2 基于非结构化或半结构化百科知识的方法 84
4.3.3 基于关联开放数据的方法 86
4.4 自下而上的语义方法 90
4.4.1 基于判别式模型的方法 90
4.5 方法比较与小结 94
4.6 总结与未来挑战 95
致谢 96
参考文献 96
第5章 基于约束的推荐系统 103
5.1 简介 103
5.2 推荐知识库的开发 105
5.3 推荐过程中的用户导向作用 108
5.4 计算推荐结果 113
5.5 实际应用的经验 114
5.6 未来的研究方法 116
5.7 总结 118
参考文献 118
第6章 情境感知推荐系统 123
6.1 简介和动机 123
6.2 推荐系统中的情境 124
6.2.1 什么是情境 124
6.2.2 推荐系统中模型化情境信息的表征性方法 125
6.2.3 推荐系统中主要的情境信息建模方法 127
6.2.4 获取情境信息 130
6.3 结合具有代表性情境的推荐系统范式 131
6.3.1 情境预过滤 133
6.3.2 情境后过滤 136
6.3.3 情境建模 137
6.4 讨论和总结 138
致谢 140
参考文献 140
第7章 推荐系统中的数据挖掘方法 145
7.1 简介 145
7.2 数据预处理 146
7.2.1 相似度度量方法 146
7.2.2 抽样 147
7.2.3 降维 148
7.2.4 去噪 150
7.3 监督学习 150
7.3.1 分类 150
7.3.2 分类器的集成 157
7.3.3 评估分类器 157
7.4 无监督学习 159
7.4.1 聚类分析 159
7.4.2 关联规则挖掘 161
7.5 总结 162
参考文献 163
第二部分 推荐系统评估 170
第8章 推荐系统的评估 170
8.1 简介 170
8.2 实验设置 171
8.2.1 离线实验 172
8.2.2 用户调查 173
8.2.3 在线评估 175
8.2.4 得出可靠结论 176
8.3 推荐系统属性 178
8.3.1 用户偏好 179
8.3.2 预测精度 179
8.3.3 覆盖率 186
8.3.4 置信度 187
8.3.5 信任度 188
8.3.6 新颖性 188
8.3.7 惊喜度 189
8.3.8 多样性 190
8.3.9 效用 191
8.3.10 风险 191
8.3.11 健壮性 192
8.3.12 隐私 192
8.3.13 适应性 193
8.3.14 可扩展性 193
8.4 结论 193
参考文献 194
第9章 使用用户实验评估推荐系统 198
9.1 简介 198
9.2 理论基础与现有工作 199
9.2.1 理论基础:Knij nenburg等人提出的评估框架 199
9.2.2 现有以用户为中心的研究概览以及有前景的方向 201
9.3 实践指南 203
9.3.1 研究模型 203
9.3.2 参与者 206
9.3.3 实验操控 207
9.3.4 测量 209
9.3.5 统计评估 214
9.4 结论 219
参考文献 221
第10章 对推荐结果的解释:设计和评估 228
10.1 简介 228
10.2 推荐设计的呈现和交互 229
10.2.1 推荐呈现 229
10.2.2 偏好提取 230
10.3 解释风格 231
10.3.1 基于协作的解释风格 232
10.3.2 基于内容的解释风格 233
10.3.3 基于案例推理(CBR)的解释风格 234
10.3.4 基于知识和基于效用的解释风格 234
10.3.5 基于人口统计的解释方式 235
10.4 目标和度量 235
10.4.1 系统如何工作:透明性 237
10.4.2 允许用户告诉系统它是错误的:被理解 237
10.4.3 增加用户对系统的信任:信任度 238
10.4.4 说服用户尝试或购买:说服力 239
10.4.5 帮助用户充分地决策:有效性 239
10.4.6 帮助用户快速制定决策:效率 240
10.4.7 系统满意度 241
10.5 未来的方向 242
10.5.1 推荐的社会性 242
10.5.2 解释、偶然性和过滤泡泡 242
10.5.3 应该何时展现推荐解释 242
10.5.4 推荐解释:有益还是有害 242
参考文献 243
第三部分 推荐系统应用 248
第11章 工业界的推荐系统:Netflix案例分析 248
11.1 简介 248
11.2 推荐系统在工业界中的应用 248
11.3 Netflix大奖赛 250
11.4 评分预测之外的推荐工作 251
11.4.1 推荐无处不在 251
11.4.2 排序 253
11.4.3 页面优化 254
11.5 数据和模型 255
11.5.1 数据 255
11.5.2 模型 256
11.6 消费者数据科学 256
11.7 架构 258
11.7.1 事件和数据分布系统 259
11.7.2 线下、近似在线、线上计算 260
11.7.3 推荐结果 261
11.8 可扩展的研究方向 261
11.8.1 隐式反馈 262
11.8.2 个性化排序学习 262
11.8.3 全页优化 262
11.8.4 情景推荐 263
11.8.5 评测及标准 263
11.8.6 类别不平衡及其效应 263
11.8.7 社交推荐 264
11.9 结论 264
参考文献 265
第12章 辅助学习的推荐系统综述 271
12.1 简介 271
12.2 技术增强学习 272
12.3 技术增强学习推荐系统的分类框架 273
12.4 方法综述 274
12.4.1 方法和技术增强学习推荐系统综述 274
12.4.2 框架分析 278
12.5 结论 284
致谢 287
参考文献 287
第13章 音乐推荐系统 294
13.1 简介 294
13.2 基于内容的音乐推荐 295
13.2.1 元数据信息 295
13.2.2 音频内容 296
13.3 基于上下文的音乐推荐 298
13.3.1 环境相关的上下文 298
13.3.2 用户相关的上下文 300
13.3.3 在音乐推荐系统中结合上下文信息 300
13.4 混合音乐推荐 301
13.4.1 结合内容与上下文描述符 302
13.4.2 结合协同过滤与内容描述符 302
13.4.3 结合协同过滤与上下文描述符 304
13.5 自动生成播放列表 305
13.5.1 并行和序列消费 305
13.5.2 播放列表评估 306
13.5.3 播放列表生成算法 307
13.6 数据集和评估 308
13.6.1 评估方法 309
13.6.2 Yahoo!Music数据集和KDD Cup 2011 310
13.6.3 百万级别歌曲数据集(MSD)和MSD Challenge 2012 310
13.6.4 Last.fm数据集:360K/1K用户 311
13.6.5 MusicMicro和百万级别音乐数据集(MMTD) 311
13.6.6 AotM-2011 312
13.7 总结与挑战 312
参考文献 312
第14章 剖析基于位置的移动推荐系统 320
14.1 简介 320
14.2 移动推荐系统的数据 321
14.2.1 发现兴趣点和位置偏好 322
14.2.2 根据智能手机传感器的行为推导 323
14.3 移动应用中计算推荐的方法 323
14.3.1 推荐形式化概述 324
14.3.2 推荐场所的算法 325
14.4 移动推荐的评估 326
14.5 结论和未来方向 327
参考文献 328
第15章 社会化推荐系统 332
15.1 简介 332
15.2 内容推荐 332
15.2.1 关键领域 333
15.2.2 群组推荐 334
15.2.3 案例研究:企业社交媒体推荐 335
15.2.4 小结 337
15.3 人物推荐 338
15.3.1 推荐连接的人 339
15.3.2 推荐陌生人 341
15.3.3 推荐被关注者 342
15.3.4 相关研究领域 343
15.3.5 小结 343
15.4 讨论 343
15.5 新兴领域和开放性挑战 345
15.5.1 新兴领域 345
15.5.2 开放性挑战 346
参考文献 346
第16章 人与人之间的相互推荐 351
16.1 简介 351
16.2 互惠推荐与传统推荐 351
16.3 关于人与人推荐的已有工作 352
16.3.1 社交网络 352
16.3.2 师徒匹配 353
16.3.3 工作推荐 353
16.3.4 在线婚恋 354
16.4 在线婚恋系统案例分析 355
16.4.1 一种基于内容—协同双向在线婚恋推荐系统 356
16.4.2 显式与隐式的用户偏好 359
16.5 总结与未来工作 362
参考文献 363
第17章 社交网络搜索中的协作、信用机制和推荐系统 365
17.1 简介 365
17.2 网络搜索的历史简介 366
17.3 网络搜索的未来 368
17.3.1 个性化网络搜索 368
17.3.2 协同信息检索 371
17.3.3 关于信誉与推荐 372
17.3.4 向社交搜索前进 373
17.4 案例研究1:HeyStaks——社交搜索用例 373
17.4.1 HeyStaks系统 374
17.4.2 HeyStaks推荐引擎 374
17.4.3 评估 376
17.5 案例研究2:社会搜索的信誉模型 377
17.5.1 从活动到信誉 378
17.5.2 信誉作为协同 378
17.5.3 实例 379
17.5.4 基于图的信誉模型 379
17.5.5 从用户信誉到结果推荐 380
17.5.6 评估 381
17.6 搜索未来 383
17.6.1 从搜索到发现 383
17.6.2 在传感器丰富的移动世界中搜索 383
致谢 384
参考文献 384
第四部分 人机交互 392
第18章 人类决策过程与推荐系统 392
18.1 简介 392
18.2 选择模式和推荐 393
18.2.1 基于属性的选择 394
18.2.2 基于结果的选择 395
18.2.3 基于经验的选择 395
18.2.4 基于社会的选择 396
18.2.5 基于策略的选择 396
18.2.6 基于反复试错的选择 397
18.2.7 混合模式的选择 397
18.2.8 什么是一个好的选择 398
18.3 支持选择策略和推荐 398
18.3.1 代表选择者的评估 398
18.3.2 选择过程的建议 399
18.3.3 获取信息与经验 399
18.3.4 代表选择的情景 400
18.3.5 合并和计算 400
18.3.6 设计域 400
18.3.7 支持策略的结束语 400
18.4 论证和解释 400
18.4.1 论证 400
18.4.2 推荐的可解释性 401
18.5 偏好和评级 402
18.5.1 什么是“偏好” 402
18.5.2 评分反映了什么 403
18.6 消除选择过载 405
18.7 支持性的反复试错法 405
18.7.1 有稳定评判标准的反复试错法 406
18.7.2 有变化评判标准的反复试错法 407
18.8 处理在选择过程中潜在噪声造成的影响 407
18.8.1 上下文效应 407
18.8.2 顺序效应 408
18.8.3 框架效应 408
18.8.4 启动效应 409
18.8.5 默认值 409
18.9 总结 410
致谢 410
参考文献 411
第19章 推荐系统中的隐私问题 415
19.1 简介 415
19.2 推荐系统中的隐私风险 416
19.2.1 由推荐系统导致的风险 417
19.2.2 由普通用户导致的风险 419
19.2.3 由外部人员导致的风险 420
19.2.4 小结 420
19.3 隐私保护方法 421
19.3.1 面向架构与系统设计的方案 422
19.3.2 面向算法的方案 425
19.3.3 基于政策的方案 429
19.4 人的因素和对于隐私的认知 430
19.4.1 透明化与管控的局限性 431
19.4.2 隐私助推 432
19.4.3 隐私自适应 433
19.5 总结与思考 434
参考文献 435
第20章 影响推荐系统可信度评估的来源因素 442
20.1 简介 442
20.2 在线来源的可信度评估 442
20.3 推荐系统作为社交参与者 443
20.4 人际交互中的来源因素 443
20.4.1 来源可信度 443
20.4.2 来源线索 444
20.5 人-技术交互中的来源因素 445
20.6 用户与推荐系统交互的来源因素 446
20.6.1 推荐系统类型 447
20.6.2 输入特征 447
20.6.3 过程特征 447
20.6.4 输出特征 448
20.6.5 嵌入式智能代理特征 448
20.6.6 新兴社交技术的影响 449
20.7 讨论 449
20.8 影响 450
20.9 未来研究方向 451
参考文献 451
第21章 用户性格和推荐系统 459
21.1 简介 459
21.2 什么是性格特征 460
21.2.1 五因素性格模型 460
21.2.2 其他性格模型 461
21.2.3 用户性格与用户偏好如何相关 462
21.3 性格采集 462
21.3.1 显式性格采集方法 463
21.3.2 隐式性格采集方法 464
21.3.3 推荐系统的线下实验数据集 466
21.4 如何在推荐系统中使用用户性格 466
21.4.1 解决新用户的问题 467
21.4.2 多样性/意外收获 468
21.4.3 跨域推荐 469
21.4.4 群组推荐 469
21.5 难题和挑战 469
21.5.1 非侵入式方法获取性格信息 469
21.5.2 大规模数据集 470
21.5.3 跨域应用 470
21.5.4 多样性 470
21.5.5 隐私问题 470
21.6 总结 471
致谢 471
参考文献 471
第五部分 高级话题 476
第22章 组推荐系统:聚合、满意度和组属性 476
22.1 简介 476
22.2 组推荐的应用场景和分类 477
22.2.1 使用场景1:交互式电视 477
22.2.2 使用场景2:环境智能 477
22.2.3 应用场景背后的相关工作 478
22.2.4 组推荐系统的分类 478
22.3 合并策略 479
22.3.1 合并策略概览 480
22.3.2 合并策略在相关工作中的应用 481
22.3.3 哪种策略性能最佳 482
22.4 序列顺序的影响 484
22.5 对情感状态建模 486
22.5.1 对个人满意度进行建模 486
22.5.2 个人满意度对群组的影响 487
22.6 满意度在聚合策略中的使用 488
22.7 组合属性:角色、个性、专长、关系强度、关系类型和个人影响 488
22.8 对单个用户进行组推荐 490
22.8.1 多准则 490
22.8.2 冷启动问题 491
22.8.3 虚拟组成员 492
22.9 总结和挑战 492
22.9.1 提出的主要问题 492
22.9.2 警告:组建模 493
22.9.3 面临的挑战 494
致谢 495
参考文献 495
第23章 推荐系统中的聚合功能 498
23.1 简介 498
23.2 推荐系统中的聚合类型 498
23.2.1 协同过滤中的偏好聚合 499
23.2.2 CB与UB推荐中的特征聚合 500
23.2.3 物品和用户相似度计算以及邻居集的构建方式 500
23.2.4 CB与UB的用户配置文件构建 501
23.2.5 基于实例推理的连接词在推荐系统中的应用 501
23.2.6 加权混合系统 502
23.3 聚合函数概述 502
23.3.1 定义和属性 502
23.3.2 聚合成员 504
23.4 聚合函数的构建 508
23.4.1 数据收集和处理 508
23.4.2 期望属性、语义、解释 509
23.4.3 函数表现的复杂度及其理解 510
23.4.4 基于惩罚的构造方法 510
23.4.5 权重和参数的确定 511
23.5 推荐系统中的复杂聚合过程:为特定应用定制 511
23.6 总结 514
参考文献 514
第24章 推荐系统中的主动学习 517
24.1 简介 517
24.1.1 推荐系统中主动学习的目标 518
24.1.2 例证 519
24.1.3 主动学习的类型 519
24.2 数据集的属性 520
24.3 主动学习在推荐系统中的应用 521
24.4 基于不确定性的主动学习 523
24.4.1 输出不确定性 524
24.4.2 决策边界不确定性 525
24.4.3 模型不确定性 525
24.5 基于误差的主动学习 527
24.5.1 基于实例的方法 527
24.5.2 基于模型的方法 529
24.6 基于组合的主动学习 529
24.6.1 基于模型的方法 530
24.6.2 基于候选的方法 530
24.7 基于会话的主动学习 532
24.7.1 基于实例的评论 532
24.7.2 基于多样性的方法 533
24.7.3 基于查询编辑的方法 533
24.8 评估的设置 533
24.8.1 范围 533
24.8.2 获取自然评分 534
24.8.3 时间的演化 534
24.8.4 可比性 535
24.8.5 小结 535
24.9 计算因素的考虑 536
24.10 总结 536
参考文献 537
第25章 多准则推荐系统 541
25.1 简介 541
25.2 多准则评分推荐 543
25.2.1 传统的单准则评分推荐问题 543
25.2.2 引入多准则评分来扩展传统推荐系统 544
25.3 预测中使用多准则评分 545
25.3.1 启发式方法 546
25.3.2 基于模型的方法 548
25.4 推荐中使用多准则评分 552
25.4.1 相关工作:多准则优化 553
25.4.2 设计物品推荐整体序列 553
25.4.3 发现帕累托最优的物品推荐 554
25.4.4 使用多准则评分作为推荐过滤器 554
25.5 讨论及未来工作 555
25.5.1 研究多准则评分的新技术 555
25.5.2 扩展多准则的现有技术 556
25.5.3 多准则评分的管理 556
25.6 总结 557
参考文献 557
第26章 推荐系统中的新颖性和多样性 562
26.1 简介 562
26.2 推荐系统中的新颖性和多样性 562
26.2.1 推荐系统为什么需要新颖性和多样性 563
26.2.2 新颖性和多样性的定义 564
26.2.3 其他领域的多样性 564
26.3 新颖性和多样性的评估 565
26.3.1 标记 565
26.3.2 平均列表内距离 565
26.3.3 全局长尾新颖性 566
26.3.4 用户特定的不可预测性 566
26.3.5 推荐内多样性指标 567
26.3.6 具体方法 568
26.3.7 多样性、新颖性和惊喜性 569
26.3.8 信息检索多样性 569
26.4 新颖性和多样性增强方法 570
26.4.1 结果的多样化或重排 570
26.4.2 使用聚类的多样化 571
26.4.3 基于融合的方法 572
26.4.4 多样性排序学习 572
26.4.5 惊喜性:使令人惊讶的推荐成为可能 572
26.4.6 其他方法 572
26.4.7 用户研究 573
26.4.8 信息检索中多样化的方法 573
26.5 统一框架 574
26.5.1 通用的新颖性/多样性度量方案 574
26.5.2 物品新颖性模型 574
26.5.3 指标生成 575
26.5.4 连接推荐多样性和检索多样性 577
26.6 实验指标比较 579
26.7 总结 581
参考文献 581
第27章 跨领域推荐系统 586
27.1 简介 586
27.2 跨领域推荐问题的表示 587
27.2.1 领域的定义 587
27.2.2 跨领域推荐的任务 589
27.2.3 跨领域推荐的目标 590
27.2.4 跨领域推荐的场景 591
27.3 跨领域推荐技术的分类 592
27.4 基于知识聚合的跨领域推荐 595
27.4.1 合并单个领域的用户偏好 595
27.4.2 整合单个领域的用户模型数据 598
27.4.3 综合单个领域的推荐结果 599
27.5 基于知识连接和迁移的跨领域推荐 600
27.5.1 连接领域 600
27.5.2 领域间的潜在特征共享 602
27.5.3 领域间的评分模式迁移 604
27.6 跨领域推荐系统的评估 606
27.6.1 数据划分 606
27.6.2 评估指标 607
27.6.3 敏感性分析 608
27.7 跨领域推荐中的现实考量 609
27.8 开放的研究问题 610
参考文献 611
第28章 具有鲁棒性的协同推荐 615
28.1 简介 615
28.2 问题定义 616
28.3 攻击分类 617
28.3.1 基础攻击 618
28.3.2 非充分信息攻击 618
28.3.3 打压攻击模型 619
28.3.4 知情攻击模型 619
28.3.5 混淆攻击 620
28.4 评估系统鲁棒性 621
28.4.1 评估指标 621
28.4.2 推举攻击 621
28.4.3 打压攻击 623
28.4.4 知情攻击 624
28.4.5 攻击效果 624
28.5 攻击检测 624
28.5.1 评估指标 625
28.5.2 单用户检测 626
28.5.3 用户信息组检测 627
28.5.4 检测发现 630
28.6 超越基于内存的算法 630
28.6.1 基于模型的推荐 630
28.6.2 隐私保护算法 631
28.6.3 影响力限制器和基于信誉的推荐 631
28.7 鲁棒的算法 631
28.7.1 鲁棒的矩阵分解算法 631
28.7.2 其他具有鲁棒性的推荐算法 632
28.8 应对推荐系统攻击的实际措施 632
28.9 总结 633
致谢 633
参考文献 633