第一章 绪论 1
1.1背景介绍 1
1.1.1类不均衡问题 2
1.1.2类重叠问题 7
1.1.3集成学习问题 8
1.2相关研究分析 9
1.2.1复杂数据研究分析 9
1.2.2类重叠问题研究分析 11
1.2.3集成学习研究分析 12
1.3研究意义与目的 16
1.4研究方法与研究内容 18
1.4.1研究方法 18
1.4.2研究内容与本书结构 19
第二章 相关研究综述 22
2.1复杂数据分析的理论研究 22
2.2复杂数据分析的算法研究 24
2.2.1重抽样 24
2.2.2成本敏感学习 26
2.2.3集成学习方法 27
2.2.4划分方法 28
2.2.5调整归纳偏置 28
2.2.6单类学习 29
2.2.7特征选择方法 31
2.2.8其他方法 32
2.3复杂数据分析的评价指标研究 32
2.3.1点指标 32
2.3.2图指标 36
2.4本章小结 38
第三章 基于局部支持向量数据描述的复杂数据分析算法研究 39
3.1引言 39
3.2数据固有结构对复杂数据分析算法的影响 41
3.3支持向量数据描述的原理及算法 42
3.4基于局部支持向量数据描述的复杂数据分析算法 46
3.5本章小结 49
第四章 类重叠问题及其处理方法研究 50
4.1引言 50
4.2基本分类算法介绍 51
4.2.1朴素贝叶斯(NB) 51
4.2.2 K最近邻法(k-NN) 52
4.2.3支持向量机(SVMs) 53
4.2.4决策树C4.5 54
4.2.5规则分类器(RIPPER) 55
4.3类重叠问题对分类的影响 55
4.4类重叠学习框架 63
4.4.1 SVDD:重叠区域识别方法 63
4.4.2 NB:重叠区域识别方法 64
4.4.3类重叠问题的处理算法 66
4.5基于SVMs的分析 68
4.6本章小结 71
第五章 一致性分类方法研究 72
5.1引言 72
5.2集成学习方法 73
5.2.1集成学习方法的原理 73
5.2.2 Bagging 76
5.2.3 AdaBoost 76
5.3基于局部聚类的组合复杂数据分析算法 78
5.5本章小结 80
第六章 复杂数据分析应用研究 82
6.1引言 82
6.2复杂数据分析的应用过程 83
6.3网络入侵检测应用研究 85
6.3.1网络入侵检测数据集 87
6.3.2数据预处理 92
6.3.3类重叠处理 93
6.3.4实验结果和分析 95
6.4 C2C电子商务共谋欺诈研究 96
6.4.1 C2C电子商务信用机制及欺诈识别研究综述 98
6.4.2实验结果和分析 99
6.5本章小结 104
结论 105
参考文献 110