《主动采样与标注估计技术研究及应用》PDF下载

  • 购买积分:7 如何计算积分?
  • 作  者:吴伟宁著
  • 出 版 社:北京:科学出版社
  • 出版年份:2017
  • ISBN:9787030533241
  • 页数:100 页
图书介绍:本书共分为5章.第1章概述了主动学习中样例选择方法,并对噪声-标注主动学习模型进行定义,给出了多标注者或大规模未标注样本环境下的主动学习问题。第2章主要讨论了多标注者环境下的准确度估计问题,给出了如何从收集到的噪声标注中判断和选择可靠标注者的方法。第3章考虑了大规模未标注样本集中的噪声数据和样本分布不均衡对分类模型的影响,给出了如何利用分类模型风险来选取信息含量最高的未标注样本。第4章考虑了从大规模未标注样本集选取样本的效率问题,给出了基于哈希技术的快速主动采样方法。最后一章是对主动采样策略做了一些总结性的工作。

第1章 绪论 1

1.1 主动学习的背景 1

1.2 主动学习的技术特点 3

1.3 主动学习的研究现状 5

1.3.1 主动学习过程 6

1.3.2 主动学习分类 7

1.3.3 主动学习的理论分析 8

1.4 主动样本选择方法概述 10

1.4.1 基于不确定性的样本选择方法 11

1.4.2 基于版本空间缩减的样本选择方法 14

1.4.3 基于误差缩减的样本选择方法 16

1.5 本书主要内容安排 17

第2章 加权样本选择 19

2.1 方法的提出 19

2.2 研究动态 20

2.3 最小化风险期望误差 21

2.3.1 基本模型 22

2.3.2 算法步骤 23

2.3.3 算法分析 24

2.4 实验与讨论 26

第3章 分布优化样本选择 33

3.1 问题的提出 33

3.2 样本选择过程 34

3.3 图像分类应用 37

第4章 主动标注估计 42

4.1 代价-增益模型 42

4.2 标注估计技术 45

4.3 多标注者环境下主动标注估计技术 47

4.3.1 基本框架 48

4.3.2 参数估计 50

4.3.3 学习算法设计步骤 52

4.4 仿真研究 53

4.4.1 基本设置 54

4.4.2 性能比较 55

第5章 快速样本选择方法 70

5.1 样本选择效率 70

5.2 基于margin的样本选择 72

5.3 基于Hash数据结构的样本选择方法 74

5.3.1 近似距离 74

5.3.2 权重选择 75

5.4 图像检索应用 78

参考文献 85