《类别不平衡学习 理论与算法》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:于化龙著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2017
  • ISBN:9787302466185
  • 页数:231 页
图书介绍:本书针对机器学习中的热点问题之一类不平衡学习问题,分别从其基础理论、核心算法、预判策略三方面进行了详细介绍。在其基础理论部分,本书分别以朴素贝叶斯、支持向量机及极限学习机三种分类器为例介绍了样本不平衡分布对分类性能的影响机理,并对各种影响因素进行了广泛探讨。

第1章 绪论 1

1.1 引言 3

1.2 基本概念 5

1.3 常用技术 7

1.4 应用领域 13

1.5 本书主要内容及安排 15

1.6 文献导读 16

参考文献 17

第2章 基础理论 23

2.1 类别不平衡分布对传统分类器性能的影响机理 25

2.1.1 类别不平衡分布对朴素贝叶斯分类器的影响 25

2.1.2 类别不平衡分布对支持向量机的影响 27

2.1.3 类别不平衡分布对极限学习机的影响 30

2.2 类别不平衡学习的影响因素 34

2.3 类别不平衡学习的性能评价测度 39

2.4 本章小结 43

2.5 文献导读 43

参考文献 43

第3章 样本采样技术 45

3.1 样本采样技术的基本思想及发展历程 47

3.2 随机采样技术 48

3.2.1 随机降采样法 48

3.2.2 随机过采样法 50

3.3 人工采样技术 51

3.3.1 SMOTE采样法 51

3.3.2 Borderline-SMOTE采样法 53

3.3.3 ADA-SYN采样法 56

3.3.4 OSS采样法 57

3.3.5 SBC采样法 58

3.4 优化采样技术 60

3.5 实验结果及讨论 65

3.5.1 数据集描述及参数设置 65

3.5.2 结果与讨论 67

3.6 本章小结 69

3.7 文献导读 69

参考文献 69

第4章 代价敏感学习技术 73

4.1 代价敏感学习的基本思想 75

4.2 代价矩阵 76

4.3 基于经验加权的代价敏感学习算法 77

4.3.1 CS-SVM算法 77

4.3.2 WELM算法 78

4.4 基于模糊加权的代价敏感学习算法 80

4.4.1 FSVM-CIL算法 81

4.4.2 FWELM算法 84

4.5 实验结果与讨论 85

4.5.1 数据集与参数设置 85

4.5.2 结果与讨论 87

4.6 本章小结 94

4.7 文献导读 94

参考文献 94

第5章 决策输出补偿技术 97

5.1 决策输出补偿技术的基本思想 99

5.2 基于经验的决策输出补偿算法 101

5.3 基于关键位置比对的决策输出补偿算法 102

5.4 基于优化思想的决策输出补偿算法 104

5.5 实验结果与讨论 109

5.5.1 实验一 109

5.5.2 实验二 116

5.6 本章小结 123

5.7 文献导读 124

参考文献 124

第6章 集成学习技术 127

6.1 集成学习的基本思想 129

6.2 两种经典的集成学习范式 131

6.2.1 Bagging集成学习范式 131

6.2.2 Boosting集成学习范式 133

6.3 基于样本采样技术的集成学习算法 135

6.3.1 Assymetric Bagging及asBagging-FSS算法 135

6.3.2 SMOTEBoost及RUSBoost算法 139

6.3.3 EasyEnsemble及BalanceCascade算法 141

6.4 基于代价敏感学习技术的集成学习算法 143

6.5 基于决策输出补偿技术的集成学习算法 145

6.6 实验结果与讨论 147

6.6.1 实验一 147

6.6.2 实验二 153

6.6.3 实验三 156

6.7 本章小结 160

6.8 文献导读 161

参考文献 161

第7章 主动学习技术 165

7.1 主动学习的基本思想 167

7.2 基于支持向量机的主动不平衡学习算法 169

7.3 样本不平衡分布中的主动学习算法设计 173

7.4 实验结果与讨论 176

7.4.1 实验一 176

7.4.2 实验二 178

7.5 本章小结 183

7.6 文献导读 184

参考文献 184

第8章 一类分类技术 187

8.1 一类分类的基本思想 189

8.2 基于密度的一类分类器 190

8.2.1 基于高斯模型的一类分类器 190

8.2.2 基于高斯混合模型的一类分类器 191

8.2.3 基于Parzen窗的一类分类器 192

8.2.4 基于K近邻的一类分类器 193

8.3 基于支持域的一类分类器 195

8.3.1 一类支持向量机 195

8.3.2 支持向量数据描述 196

8.4 一类极限学习机 197

8.5 实验结果与讨论 199

8.5.1 数据集与参数设置 199

8.5.2 结果与讨论 200

8.6 本章小结 202

8.7 文献导读 202

参考文献 202

第9章 样本不平衡分布的危害预评估技术 205

9.1 预评估的必要性说明 207

9.2 基于样本几何可分测度的预评估算法 208

9.3 基于留一交叉验证的预评估算法 212

9.4 实验结果与讨论 214

9.4.1 实验一 214

9.4.2 实验二 217

9.5 本章小结 219

9.6 文献导读 219

参考文献 220

第10章 未来研究展望 223

10.1 现有的挑战 225

10.2 未来的研究方向与发展前景 227

10.3 文献导读 228

参考文献 229