《不均衡数据SVM分类算法及其应用》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:陶新民,刘福荣,杜宝祥著
  • 出 版 社:哈尔滨:黑龙江科学技术出版社
  • 出版年份:2011
  • ISBN:9787538868326
  • 页数:348 页
图书介绍:支持向量机(SVM)是以统计学习理论为基础的一种新型机器学习方法。本著作首先描述不均衡学习问题对SVM算法的影响,然后介绍基于数据预处理的不均衡数据分类方法、集成分类算法及理论分析、如何利用SVM算法自身的性质解决不均衡数据分类问题等内容。

第一章 概述 1

1.1问题的本质 4

1.2国内外不均衡学习研究现状 11

1.2.1算法层面的处理方法 12

1.2.2样本层面的处理方法 13

1.3评估指标 14

1.4本书的安排 17

第二章支持向量机综述 19

2.1支持向量机 20

2.1.1最优分类界面的定义 20

2.1.2最优分类界面的构建 23

2.1.3广义最优分类界面 26

2.1.4支持向量机的构建 29

2.2核函数 30

2.2.1高斯核函数 32

2.2.2多项式核函数 32

2.2.3S型核函数 32

2.3不均衡数据对SVM性能的影响 33

2.4本章小结 35

第三章不均衡学习的抽样方法 37

3.1随机过抽样和欠抽样 37

3.2 informed欠抽样 38

3.3数据生成的合成抽样方法 43

3.4自适应合成抽样方法 45

3.5利用数据清洁技术的抽样 50

3.6基于聚类的抽样方法 53

3.7抽样和Boosting算法的集成 56

3.8实验分析 58

3.9本章小结 68

第四章基于ODR和BSMOTE的不均衡SVM分类算法 71

4.1 KNN算法 71

4.2 ODR欠抽样算法 73

4.3 ODR-BSMOTE-SVM算法 75

4.4对比算法简介 77

4.4.1 RU-BSMOTE-SVM算法 77

4.4.2 KSMOTE-SVM算法 79

4.5仿真实验及性能分析 80

4.5.1实验数据 80

4.5.2不同算法的性能比较 81

4.5.3不同比例下不均衡数据的性能比较 84

4.5.4参数α对算法性能的影响 86

4.5.5分析结论 90

4.6本章小结 90

第五章基于阴性免疫过抽样的不均衡分类算法 93

5.1不均衡数据下传统过抽样算法 94

5.2基于阴性免疫的过抽样算法 95

5.2.1检测器表示及亲和度定义 95

5.2.2检测器移动操作 96

5.2.3检测器间覆盖度的测量标准 96

5.2.4检测器克隆增殖操作 97

5.2.5检测器变异操作 97

5.2.6检测器克隆选择及消亡操作 98

5.3基于阴性免疫的过抽样算法流程 99

5.4对标称值属性的处理 101

5.5仿真实验及性能分析 101

5.5.1 NI算法生成人工样本的试验 101

5.5.2不同过抽样算法的性能对比试验 103

5.5.3不同不均衡数据比例的性能对比试验 105

5.5.4分析与总结 106

5.6本章小结 108

第六章基于谱聚类欠抽样不均衡SVM分类算法 109

6.1 SVM在不均衡数据下分类边界的偏移 110

6.2基于谱聚类的欠抽样算法 112

6.2.1传统欠抽样算法分析 112

6.2.2基于谱聚类的欠抽样 113

6.3基于谱聚类欠抽样不均衡SVM算法 115

6.4实验分析及对比 117

6.4.1实验数据 117

6.4.2不同算法的分类性能比较 117

6.4.3不同比例下不均衡数据分类性能比较 129

6.4.4高斯核半径的参数对算法性能的影响 129

6.5本章小结 134

第七章集成方法 137

7.1分类器集成学习 138

7.2 Bagging 141

7.3随机森林 143

7.4 Boosting 143

7.4.1 AdaBoost算法 145

7.4.2上边界定理及参数α的选择 148

7.4.3加权的效率 151

7.4.4前向的stagewise累计模型 152

7.5本章小结 153

第八章集成算法的理论分析 155

8.1平方损失函数的混淆分解 155

8.2偏差和方差的错误分解框架 156

8.3错误分解与混淆分解的关联 157

8.4多数投票策略集成的错误分解 160

8.5差异性创建策略 162

8.5.1训练样本的处理 162

8.5.2结构的处理 165

8.5.3惩罚项方法 165

8.5.4进化方法 168

8.6不同训练集下分类器的偏差和方差错误测试方法 171

8.7 SVM集成算法性能随核参数变化试验 174

8.8不同分类器之间的差异性度量方法 178

8.9采样率对分类精度的影响试验 180

8.10本章小结 185

第九章两类不均衡数据学习的代价敏感学习算法 187

9.1代价敏感的AdaBoost算法 189

9.1.1 AdaC1算法 191

9.1.2 AdaC2算法 193

9.1.3 AdaC3算法 196

9.1.4三种算法性能分析 199

9.2成本敏感指数损失和AdaC2 201

9.3代价因子分析 202

9.4其他相关的算法 204

9.4.1 AdaCost算法 205

9.4.2 CSB1和CSB2算法 206

9.4.3 RareBoost算法 206

9.5重抽样的影响 207

9.6多类别不均衡数据分类算法 211

9.7实验分析 215

9.8本章小结 216

第十章基于核聚类欠抽样集成不均衡SVM分类算法 223

10.1 SVM在不均衡数据下分类边界的偏移 223

10.2基于核聚类的欠抽样SVM算法 225

10.2.1传统欠抽样算法分析 225

10.2.2基于核聚类的欠抽样 227

10.3基于核聚类欠抽样集成SVM分类算法 230

10.4核聚类欠抽样集成SVM算法复杂度 231

10.5仿真实验及性能分析 232

10.5.1实验数据 232

10.5.2不同数据预处理算法的分类性能比较 232

10.5.3不同比例下不均衡数据分类性能比较 234

10.5.4不同比例下不同算法的效率比较 248

10.5.5不同不均衡数据集成分类算法性能比较 248

10.5.6高斯核半径的参数对算法性能的影响 257

10.6本章小结 259

第十一章核偏移及主动学习欠抽样不均衡SVM算法 261

11.1核边界偏移算法 262

11.2 KBA算法流程 264

11.3主动学习欠抽样策略 266

11.3.1 SVM在不均衡数据下分类边界的偏移 266

11.3.2传统欠抽样算法分析 267

11.3.3基于主动学习的欠抽样 269

11.3.4基于主动学习欠抽样不均衡SVM算法 270

11.4实验分析及对比 272

11.4.1实验数据 272

11.4.2不同算法的分类性能比较 273

11.4.3不同比例下不均衡数据分类性能比较 281

11.4.4 α参数对算法性能的影响 282

11.4.5参数L对算法性能的影响 291

11.5本章小结 291

第十二章不均衡SVM分类算法在故障诊断中的应用 295

12.1故障检测的内容介绍 296

12.2故障特征参量的选取 298

12.3 ODR-BSMOTE故障诊断方法实验 299

12.3.1不同比例故障数据下算法性能分析 300

12.3.2参数α对算法性能的影响 301

12.3.3参数k对算法性能的影响 306

12.3.4泛化能力对比实验 307

12.3.5分析结论 308

12.4基于BSMOTE代价敏感不均衡故障诊断算法 309

12.4.1不均衡数据对SVM检测性能的影响试验 309

12.4.2不同SVM不均衡分类策略的对比实验 310

12.4.3 BSMOTE参数对SVM性能的影响试验 313

12.4.4泛化能力对比实验 313

12.4.5分析与讨论 315

12.5本章小结 315

第十三章结论与展望 317

参考文献 323