《计算机科学丛书 系统技术评估及高效算法 原书第2版》PDF下载

  • 购买积分:18 如何计算积分?
  • 作  者:(美)弗朗西斯科,里奇Francesco著;李艳民译
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2018
  • ISBN:9787111600756
  • 页数:636 页
图书介绍:本书由五部分组成:推荐系统的技术、评估、应用、人机交互及高级话题。第一部分展示了如今构建推荐系统的最流行和最基础的技术,如协同过滤、基于语义的方法、数据挖掘方法和基于情境感知的方法。第二部分主要关注离线和真实用户环境下用于评估推荐质量的技术及方法。第三部分包括了一些推荐技术多样性的应用。首先简述了与工业实现和推荐系统开发相关的一般性问题,随后详细介绍了推荐系统在各领域中的应用:音乐、学习、移动、社交网络及它们之间的交互。第四部分包含了探讨一系列问题的文章,这些问题包括推荐的展示、浏览、解释和视觉化以及人工决策与推荐系统相关的重要问题。第五部分收集了一些关于高级话题的文章,例如利用主动学习技术来引导新知识的学习,构建能够抵挡恶意用户攻击的健壮推荐系统的合适技术,以及结合多种用户反馈和偏好来生成更加可靠的推荐系统。

第1章 推荐系统:简介和挑战 1

1.1 简介 1

1.2 推荐系统的功能 3

1.3 数据和知识来源 5

1.4 推荐技术 7

1.5 推荐系统评估 10

1.6 推荐系统应用 11

1.7 推荐系统与人机交互 13

1.8 高级话题 14

1.9 挑战 16

1.9.1 偏好获取与分析 16

1.9.2 交互 17

1.9.3 新的推荐任务 18

参考文献 19

第一部分 推荐系统技术 24

第2章 基于邻域的推荐方法综述 24

2.1 简介 24

2.1.1 基于邻域方法的优势 25

2.1.2 目标和概要 26

2.2 问题定义和符号 26

2.3 基于邻域的推荐 27

2.3.1 基于用户的评分预测 28

2.3.2 基于用户的分类预测方法 28

2.3.3 回归与分类 29

2.3.4 基于物品的推荐 29

2.3.5 基于用户和基于物品的推荐方法的比较 30

2.4 基于邻域方法的要素 31

2.4.1 评分标准化 31

2.4.2 相似度权重的计算 33

2.4.3 邻域的选择 37

2.5 高级进阶技术 37

2.5.1 基于图的方法 38

2.5.2 基于学习的方法 40

2.6 总结 44

参考文献 44

第3章 协同过滤方法进阶 48

3.1 简介 48

3.2 预备知识 49

3.2.1 基准预测 49

3.2.2 Netflix数据 50

3.2.3 隐式反馈 51

3.3 矩阵分解模型 51

3.3.1 SVD 52

3.3.2 SVD++ 53

3.3.3 时间敏感的因子模型 54

3.3.4 比较 57

3.3.5 小结 58

3.4 基于邻域的模型 59

3.4.1 相似度度量 59

3.4.2 基于相似度的插值 60

3.4.3 联合派生插值权重 61

3.4.4 小结 63

3.5 增强的基于邻域的模型 63

3.5.1 全局化的邻域模型 64

3.5.2 因式分解的邻域模型 67

3.5.3 基于邻域模型的动态时序 71

3.5.4 小结 72

3.6 基于邻域的模型和因子分解模型的比较 73

参考文献 75

第4章 基于内容的语义感知推荐系统 77

4.1 简介 77

4.2 基于内容的推荐系统概述 77

4.2.1 基于关键词的向量空间模型 79

4.2.2 用户特征学习的方法 80

4.2.3 基于内容过滤的优缺点 81

4.3 自上而下的语义方法 82

4.3.1 基于本体资源的方法 83

4.3.2 基于非结构化或半结构化百科知识的方法 84

4.3.3 基于关联开放数据的方法 86

4.4 自下而上的语义方法 90

4.4.1 基于判别式模型的方法 90

4.5 方法比较与小结 94

4.6 总结与未来挑战 95

致谢 96

参考文献 96

第5章 基于约束的推荐系统 103

5.1 简介 103

5.2 推荐知识库的开发 105

5.3 推荐过程中的用户导向作用 108

5.4 计算推荐结果 113

5.5 实际应用的经验 114

5.6 未来的研究方法 116

5.7 总结 118

参考文献 118

第6章 情境感知推荐系统 123

6.1 简介和动机 123

6.2 推荐系统中的情境 124

6.2.1 什么是情境 124

6.2.2 推荐系统中模型化情境信息的表征性方法 125

6.2.3 推荐系统中主要的情境信息建模方法 127

6.2.4 获取情境信息 130

6.3 结合具有代表性情境的推荐系统范式 131

6.3.1 情境预过滤 133

6.3.2 情境后过滤 136

6.3.3 情境建模 137

6.4 讨论和总结 138

致谢 140

参考文献 140

第7章 推荐系统中的数据挖掘方法 145

7.1 简介 145

7.2 数据预处理 146

7.2.1 相似度度量方法 146

7.2.2 抽样 147

7.2.3 降维 148

7.2.4 去噪 150

7.3 监督学习 150

7.3.1 分类 150

7.3.2 分类器的集成 157

7.3.3 评估分类器 157

7.4 无监督学习 159

7.4.1 聚类分析 159

7.4.2 关联规则挖掘 161

7.5 总结 162

参考文献 163

第二部分 推荐系统评估 170

第8章 推荐系统的评估 170

8.1 简介 170

8.2 实验设置 171

8.2.1 离线实验 172

8.2.2 用户调查 173

8.2.3 在线评估 175

8.2.4 得出可靠结论 176

8.3 推荐系统属性 178

8.3.1 用户偏好 179

8.3.2 预测精度 179

8.3.3 覆盖率 186

8.3.4 置信度 187

8.3.5 信任度 188

8.3.6 新颖性 188

8.3.7 惊喜度 189

8.3.8 多样性 190

8.3.9 效用 191

8.3.10 风险 191

8.3.11 健壮性 192

8.3.12 隐私 192

8.3.13 适应性 193

8.3.14 可扩展性 193

8.4 结论 193

参考文献 194

第9章 使用用户实验评估推荐系统 198

9.1 简介 198

9.2 理论基础与现有工作 199

9.2.1 理论基础:Knij nenburg等人提出的评估框架 199

9.2.2 现有以用户为中心的研究概览以及有前景的方向 201

9.3 实践指南 203

9.3.1 研究模型 203

9.3.2 参与者 206

9.3.3 实验操控 207

9.3.4 测量 209

9.3.5 统计评估 214

9.4 结论 219

参考文献 221

第10章 对推荐结果的解释:设计和评估 228

10.1 简介 228

10.2 推荐设计的呈现和交互 229

10.2.1 推荐呈现 229

10.2.2 偏好提取 230

10.3 解释风格 231

10.3.1 基于协作的解释风格 232

10.3.2 基于内容的解释风格 233

10.3.3 基于案例推理(CBR)的解释风格 234

10.3.4 基于知识和基于效用的解释风格 234

10.3.5 基于人口统计的解释方式 235

10.4 目标和度量 235

10.4.1 系统如何工作:透明性 237

10.4.2 允许用户告诉系统它是错误的:被理解 237

10.4.3 增加用户对系统的信任:信任度 238

10.4.4 说服用户尝试或购买:说服力 239

10.4.5 帮助用户充分地决策:有效性 239

10.4.6 帮助用户快速制定决策:效率 240

10.4.7 系统满意度 241

10.5 未来的方向 242

10.5.1 推荐的社会性 242

10.5.2 解释、偶然性和过滤泡泡 242

10.5.3 应该何时展现推荐解释 242

10.5.4 推荐解释:有益还是有害 242

参考文献 243

第三部分 推荐系统应用 248

第11章 工业界的推荐系统:Netflix案例分析 248

11.1 简介 248

11.2 推荐系统在工业界中的应用 248

11.3 Netflix大奖赛 250

11.4 评分预测之外的推荐工作 251

11.4.1 推荐无处不在 251

11.4.2 排序 253

11.4.3 页面优化 254

11.5 数据和模型 255

11.5.1 数据 255

11.5.2 模型 256

11.6 消费者数据科学 256

11.7 架构 258

11.7.1 事件和数据分布系统 259

11.7.2 线下、近似在线、线上计算 260

11.7.3 推荐结果 261

11.8 可扩展的研究方向 261

11.8.1 隐式反馈 262

11.8.2 个性化排序学习 262

11.8.3 全页优化 262

11.8.4 情景推荐 263

11.8.5 评测及标准 263

11.8.6 类别不平衡及其效应 263

11.8.7 社交推荐 264

11.9 结论 264

参考文献 265

第12章 辅助学习的推荐系统综述 271

12.1 简介 271

12.2 技术增强学习 272

12.3 技术增强学习推荐系统的分类框架 273

12.4 方法综述 274

12.4.1 方法和技术增强学习推荐系统综述 274

12.4.2 框架分析 278

12.5 结论 284

致谢 287

参考文献 287

第13章 音乐推荐系统 294

13.1 简介 294

13.2 基于内容的音乐推荐 295

13.2.1 元数据信息 295

13.2.2 音频内容 296

13.3 基于上下文的音乐推荐 298

13.3.1 环境相关的上下文 298

13.3.2 用户相关的上下文 300

13.3.3 在音乐推荐系统中结合上下文信息 300

13.4 混合音乐推荐 301

13.4.1 结合内容与上下文描述符 302

13.4.2 结合协同过滤与内容描述符 302

13.4.3 结合协同过滤与上下文描述符 304

13.5 自动生成播放列表 305

13.5.1 并行和序列消费 305

13.5.2 播放列表评估 306

13.5.3 播放列表生成算法 307

13.6 数据集和评估 308

13.6.1 评估方法 309

13.6.2 Yahoo!Music数据集和KDD Cup 2011 310

13.6.3 百万级别歌曲数据集(MSD)和MSD Challenge 2012 310

13.6.4 Last.fm数据集:360K/1K用户 311

13.6.5 MusicMicro和百万级别音乐数据集(MMTD) 311

13.6.6 AotM-2011 312

13.7 总结与挑战 312

参考文献 312

第14章 剖析基于位置的移动推荐系统 320

14.1 简介 320

14.2 移动推荐系统的数据 321

14.2.1 发现兴趣点和位置偏好 322

14.2.2 根据智能手机传感器的行为推导 323

14.3 移动应用中计算推荐的方法 323

14.3.1 推荐形式化概述 324

14.3.2 推荐场所的算法 325

14.4 移动推荐的评估 326

14.5 结论和未来方向 327

参考文献 328

第15章 社会化推荐系统 332

15.1 简介 332

15.2 内容推荐 332

15.2.1 关键领域 333

15.2.2 群组推荐 334

15.2.3 案例研究:企业社交媒体推荐 335

15.2.4 小结 337

15.3 人物推荐 338

15.3.1 推荐连接的人 339

15.3.2 推荐陌生人 341

15.3.3 推荐被关注者 342

15.3.4 相关研究领域 343

15.3.5 小结 343

15.4 讨论 343

15.5 新兴领域和开放性挑战 345

15.5.1 新兴领域 345

15.5.2 开放性挑战 346

参考文献 346

第16章 人与人之间的相互推荐 351

16.1 简介 351

16.2 互惠推荐与传统推荐 351

16.3 关于人与人推荐的已有工作 352

16.3.1 社交网络 352

16.3.2 师徒匹配 353

16.3.3 工作推荐 353

16.3.4 在线婚恋 354

16.4 在线婚恋系统案例分析 355

16.4.1 一种基于内容—协同双向在线婚恋推荐系统 356

16.4.2 显式与隐式的用户偏好 359

16.5 总结与未来工作 362

参考文献 363

第17章 社交网络搜索中的协作、信用机制和推荐系统 365

17.1 简介 365

17.2 网络搜索的历史简介 366

17.3 网络搜索的未来 368

17.3.1 个性化网络搜索 368

17.3.2 协同信息检索 371

17.3.3 关于信誉与推荐 372

17.3.4 向社交搜索前进 373

17.4 案例研究1:HeyStaks——社交搜索用例 373

17.4.1 HeyStaks系统 374

17.4.2 HeyStaks推荐引擎 374

17.4.3 评估 376

17.5 案例研究2:社会搜索的信誉模型 377

17.5.1 从活动到信誉 378

17.5.2 信誉作为协同 378

17.5.3 实例 379

17.5.4 基于图的信誉模型 379

17.5.5 从用户信誉到结果推荐 380

17.5.6 评估 381

17.6 搜索未来 383

17.6.1 从搜索到发现 383

17.6.2 在传感器丰富的移动世界中搜索 383

致谢 384

参考文献 384

第四部分 人机交互 392

第18章 人类决策过程与推荐系统 392

18.1 简介 392

18.2 选择模式和推荐 393

18.2.1 基于属性的选择 394

18.2.2 基于结果的选择 395

18.2.3 基于经验的选择 395

18.2.4 基于社会的选择 396

18.2.5 基于策略的选择 396

18.2.6 基于反复试错的选择 397

18.2.7 混合模式的选择 397

18.2.8 什么是一个好的选择 398

18.3 支持选择策略和推荐 398

18.3.1 代表选择者的评估 398

18.3.2 选择过程的建议 399

18.3.3 获取信息与经验 399

18.3.4 代表选择的情景 400

18.3.5 合并和计算 400

18.3.6 设计域 400

18.3.7 支持策略的结束语 400

18.4 论证和解释 400

18.4.1 论证 400

18.4.2 推荐的可解释性 401

18.5 偏好和评级 402

18.5.1 什么是“偏好” 402

18.5.2 评分反映了什么 403

18.6 消除选择过载 405

18.7 支持性的反复试错法 405

18.7.1 有稳定评判标准的反复试错法 406

18.7.2 有变化评判标准的反复试错法 407

18.8 处理在选择过程中潜在噪声造成的影响 407

18.8.1 上下文效应 407

18.8.2 顺序效应 408

18.8.3 框架效应 408

18.8.4 启动效应 409

18.8.5 默认值 409

18.9 总结 410

致谢 410

参考文献 411

第19章 推荐系统中的隐私问题 415

19.1 简介 415

19.2 推荐系统中的隐私风险 416

19.2.1 由推荐系统导致的风险 417

19.2.2 由普通用户导致的风险 419

19.2.3 由外部人员导致的风险 420

19.2.4 小结 420

19.3 隐私保护方法 421

19.3.1 面向架构与系统设计的方案 422

19.3.2 面向算法的方案 425

19.3.3 基于政策的方案 429

19.4 人的因素和对于隐私的认知 430

19.4.1 透明化与管控的局限性 431

19.4.2 隐私助推 432

19.4.3 隐私自适应 433

19.5 总结与思考 434

参考文献 435

第20章 影响推荐系统可信度评估的来源因素 442

20.1 简介 442

20.2 在线来源的可信度评估 442

20.3 推荐系统作为社交参与者 443

20.4 人际交互中的来源因素 443

20.4.1 来源可信度 443

20.4.2 来源线索 444

20.5 人-技术交互中的来源因素 445

20.6 用户与推荐系统交互的来源因素 446

20.6.1 推荐系统类型 447

20.6.2 输入特征 447

20.6.3 过程特征 447

20.6.4 输出特征 448

20.6.5 嵌入式智能代理特征 448

20.6.6 新兴社交技术的影响 449

20.7 讨论 449

20.8 影响 450

20.9 未来研究方向 451

参考文献 451

第21章 用户性格和推荐系统 459

21.1 简介 459

21.2 什么是性格特征 460

21.2.1 五因素性格模型 460

21.2.2 其他性格模型 461

21.2.3 用户性格与用户偏好如何相关 462

21.3 性格采集 462

21.3.1 显式性格采集方法 463

21.3.2 隐式性格采集方法 464

21.3.3 推荐系统的线下实验数据集 466

21.4 如何在推荐系统中使用用户性格 466

21.4.1 解决新用户的问题 467

21.4.2 多样性/意外收获 468

21.4.3 跨域推荐 469

21.4.4 群组推荐 469

21.5 难题和挑战 469

21.5.1 非侵入式方法获取性格信息 469

21.5.2 大规模数据集 470

21.5.3 跨域应用 470

21.5.4 多样性 470

21.5.5 隐私问题 470

21.6 总结 471

致谢 471

参考文献 471

第五部分 高级话题 476

第22章 组推荐系统:聚合、满意度和组属性 476

22.1 简介 476

22.2 组推荐的应用场景和分类 477

22.2.1 使用场景1:交互式电视 477

22.2.2 使用场景2:环境智能 477

22.2.3 应用场景背后的相关工作 478

22.2.4 组推荐系统的分类 478

22.3 合并策略 479

22.3.1 合并策略概览 480

22.3.2 合并策略在相关工作中的应用 481

22.3.3 哪种策略性能最佳 482

22.4 序列顺序的影响 484

22.5 对情感状态建模 486

22.5.1 对个人满意度进行建模 486

22.5.2 个人满意度对群组的影响 487

22.6 满意度在聚合策略中的使用 488

22.7 组合属性:角色、个性、专长、关系强度、关系类型和个人影响 488

22.8 对单个用户进行组推荐 490

22.8.1 多准则 490

22.8.2 冷启动问题 491

22.8.3 虚拟组成员 492

22.9 总结和挑战 492

22.9.1 提出的主要问题 492

22.9.2 警告:组建模 493

22.9.3 面临的挑战 494

致谢 495

参考文献 495

第23章 推荐系统中的聚合功能 498

23.1 简介 498

23.2 推荐系统中的聚合类型 498

23.2.1 协同过滤中的偏好聚合 499

23.2.2 CB与UB推荐中的特征聚合 500

23.2.3 物品和用户相似度计算以及邻居集的构建方式 500

23.2.4 CB与UB的用户配置文件构建 501

23.2.5 基于实例推理的连接词在推荐系统中的应用 501

23.2.6 加权混合系统 502

23.3 聚合函数概述 502

23.3.1 定义和属性 502

23.3.2 聚合成员 504

23.4 聚合函数的构建 508

23.4.1 数据收集和处理 508

23.4.2 期望属性、语义、解释 509

23.4.3 函数表现的复杂度及其理解 510

23.4.4 基于惩罚的构造方法 510

23.4.5 权重和参数的确定 511

23.5 推荐系统中的复杂聚合过程:为特定应用定制 511

23.6 总结 514

参考文献 514

第24章 推荐系统中的主动学习 517

24.1 简介 517

24.1.1 推荐系统中主动学习的目标 518

24.1.2 例证 519

24.1.3 主动学习的类型 519

24.2 数据集的属性 520

24.3 主动学习在推荐系统中的应用 521

24.4 基于不确定性的主动学习 523

24.4.1 输出不确定性 524

24.4.2 决策边界不确定性 525

24.4.3 模型不确定性 525

24.5 基于误差的主动学习 527

24.5.1 基于实例的方法 527

24.5.2 基于模型的方法 529

24.6 基于组合的主动学习 529

24.6.1 基于模型的方法 530

24.6.2 基于候选的方法 530

24.7 基于会话的主动学习 532

24.7.1 基于实例的评论 532

24.7.2 基于多样性的方法 533

24.7.3 基于查询编辑的方法 533

24.8 评估的设置 533

24.8.1 范围 533

24.8.2 获取自然评分 534

24.8.3 时间的演化 534

24.8.4 可比性 535

24.8.5 小结 535

24.9 计算因素的考虑 536

24.10 总结 536

参考文献 537

第25章 多准则推荐系统 541

25.1 简介 541

25.2 多准则评分推荐 543

25.2.1 传统的单准则评分推荐问题 543

25.2.2 引入多准则评分来扩展传统推荐系统 544

25.3 预测中使用多准则评分 545

25.3.1 启发式方法 546

25.3.2 基于模型的方法 548

25.4 推荐中使用多准则评分 552

25.4.1 相关工作:多准则优化 553

25.4.2 设计物品推荐整体序列 553

25.4.3 发现帕累托最优的物品推荐 554

25.4.4 使用多准则评分作为推荐过滤器 554

25.5 讨论及未来工作 555

25.5.1 研究多准则评分的新技术 555

25.5.2 扩展多准则的现有技术 556

25.5.3 多准则评分的管理 556

25.6 总结 557

参考文献 557

第26章 推荐系统中的新颖性和多样性 562

26.1 简介 562

26.2 推荐系统中的新颖性和多样性 562

26.2.1 推荐系统为什么需要新颖性和多样性 563

26.2.2 新颖性和多样性的定义 564

26.2.3 其他领域的多样性 564

26.3 新颖性和多样性的评估 565

26.3.1 标记 565

26.3.2 平均列表内距离 565

26.3.3 全局长尾新颖性 566

26.3.4 用户特定的不可预测性 566

26.3.5 推荐内多样性指标 567

26.3.6 具体方法 568

26.3.7 多样性、新颖性和惊喜性 569

26.3.8 信息检索多样性 569

26.4 新颖性和多样性增强方法 570

26.4.1 结果的多样化或重排 570

26.4.2 使用聚类的多样化 571

26.4.3 基于融合的方法 572

26.4.4 多样性排序学习 572

26.4.5 惊喜性:使令人惊讶的推荐成为可能 572

26.4.6 其他方法 572

26.4.7 用户研究 573

26.4.8 信息检索中多样化的方法 573

26.5 统一框架 574

26.5.1 通用的新颖性/多样性度量方案 574

26.5.2 物品新颖性模型 574

26.5.3 指标生成 575

26.5.4 连接推荐多样性和检索多样性 577

26.6 实验指标比较 579

26.7 总结 581

参考文献 581

第27章 跨领域推荐系统 586

27.1 简介 586

27.2 跨领域推荐问题的表示 587

27.2.1 领域的定义 587

27.2.2 跨领域推荐的任务 589

27.2.3 跨领域推荐的目标 590

27.2.4 跨领域推荐的场景 591

27.3 跨领域推荐技术的分类 592

27.4 基于知识聚合的跨领域推荐 595

27.4.1 合并单个领域的用户偏好 595

27.4.2 整合单个领域的用户模型数据 598

27.4.3 综合单个领域的推荐结果 599

27.5 基于知识连接和迁移的跨领域推荐 600

27.5.1 连接领域 600

27.5.2 领域间的潜在特征共享 602

27.5.3 领域间的评分模式迁移 604

27.6 跨领域推荐系统的评估 606

27.6.1 数据划分 606

27.6.2 评估指标 607

27.6.3 敏感性分析 608

27.7 跨领域推荐中的现实考量 609

27.8 开放的研究问题 610

参考文献 611

第28章 具有鲁棒性的协同推荐 615

28.1 简介 615

28.2 问题定义 616

28.3 攻击分类 617

28.3.1 基础攻击 618

28.3.2 非充分信息攻击 618

28.3.3 打压攻击模型 619

28.3.4 知情攻击模型 619

28.3.5 混淆攻击 620

28.4 评估系统鲁棒性 621

28.4.1 评估指标 621

28.4.2 推举攻击 621

28.4.3 打压攻击 623

28.4.4 知情攻击 624

28.4.5 攻击效果 624

28.5 攻击检测 624

28.5.1 评估指标 625

28.5.2 单用户检测 626

28.5.3 用户信息组检测 627

28.5.4 检测发现 630

28.6 超越基于内存的算法 630

28.6.1 基于模型的推荐 630

28.6.2 隐私保护算法 631

28.6.3 影响力限制器和基于信誉的推荐 631

28.7 鲁棒的算法 631

28.7.1 鲁棒的矩阵分解算法 631

28.7.2 其他具有鲁棒性的推荐算法 632

28.8 应对推荐系统攻击的实际措施 632

28.9 总结 633

致谢 633

参考文献 633