1绪论 1
1.1模糊分类研究的背景 1
1.2模糊分类研究的目的 4
1.3模糊分类相关的研究 5
1.3.1精简模糊规则数量的方法研究 5
1.3.2模糊分类识别率的提高方法研究 6
1.4模糊分类研究的内容 7
2模糊分类、核函数方法及支持向量机 10
2.1模糊分类 10
2.1.1模糊IF-THEN分类规则 10
2.1.2隶属度函数 13
2.1.3模糊划分 15
2.1.4基于模糊划分的分类规则产生 16
2.2核函数 19
2.3支持向量机理论 22
2.3.1线性情况 23
2.3.2非线性情况 26
3基于模糊核超球感知器的模糊分类模型 28
3.1核感知器及超球感知器 28
3.1.1核感知器 28
3.1.2超球感知器 30
3.1.3核超球感知器 31
3.2模糊核感知器 33
3.2.1模糊感知器 33
3.2.2模糊核感知器 35
3.3基于模糊核超球感知器的模糊分类模型 36
3.3.1模糊核超球感知器 36
3.3.2基于模糊核超球感知器的模糊分类模型 38
3.3.3FCMBFKHP模型分类规则的生成 40
3.4模糊IF-THEN规则的调整 41
3.4.1调整策略分析 42
3.4.2δm调整边界分析 44
3.4.3规则调整算法 49
3.5实验结果分析 50
3.5.1核函数及参数对超球产生的影响实验 50
3.5.2分类识别率比较实验 52
4基于进化式核聚类的模糊分类模型 53
4.1核聚类方法 54
4.2基于支持向量的聚类 55
4.3基于进化式核聚类的模糊分类模型 60
4.3.1FCMBEKC分类模型结构 62
4.3.2进化式核聚类算法 65
4.3.3模糊分类规则的创建及分类推理 67
4.3.4进化式核聚类算法中簇半径阈值的讨论 68
4.4基于遗传算法的模糊IF-THEN规则的调整 68
4.4.1基因编码 69
4.4.2适应度函数 71
4.4.3增强信息的确定 71
4.4.4遗传操作 72
4.5实验结果分析 72
4.5.1基于wine数据集的实验 73
4.5.2基于手写体数字识别数据集实验 74
5基于支持向量机的模糊分类模型 76
5.1模糊支持向量机的研究现状 76
5.1.1第一种模糊支持向量机 76
5.1.2第二种模糊支持向量 79
5.2基于支持向量机的模糊分类模型 81
5.2.1FCMBSVM的基本思想 81
5.2.2FCMBSVM模型结构 82
5.2.3隶属函数的选择 84
5.2.4核函数证明 85
5.2.5参数ak和b的求解 88
5.2.6模型几何特性 89
5.3FCMBSVM模型参数分析 90
5.3.1惩罚参数C 90
5.3.2隶属函数参数 93
5.4基于FCMBSVM模型的多类分类 95
5.4.1模糊IF-THEN规则表达式 95
5.4.2参数akm及bm的求解 96
5.5实验结果分析 99
5.5.1双螺旋线实验 99
5.5.2基于Image数据集实验 99
5.5.3多类分类实验 101
6基于模糊积分的多分类器集成方法 103
6.1多分类器集成 103
6.1.1多分类器集成研究的产生和现状 103
6.1.2分类器输出信息描述 104
6.1.3多分类器集成类型 105
6.1.4基于度量级信息的并联式集成方法 106
6.2模糊测度及模糊积分理论 109
6.2.1模糊测度和gλ模糊测度 109
6.2.2模糊积分 110
6.3基于模糊积分的分类器集成方法 112
6.3.1关于个体分类器生成 112
6.3.2分类器集的选择 114
6.3.3基于隶属度矩阵的模糊积分密度的确定 117
6.3.4多分类器集成方法 121
6.4实验结果分析 123
6.5小结 125
7基于模糊分类方法的网络流量分类 126
7.1基于机器学习方法的网络流量分类研究 126
7.1.1网络流量分类 126
7.1.2网络流量分类研究的意义及现状 127
7.1.3网络流量分类构建框架 132
7.2网络流量样本采集及特征产生 133
7.2.1网络流量采集 133
7.2.2流及流的候选特征形成 136
7.2.3流量样本类型自动标志 140
7.3网络流量特征选择 145
7.3.1特征选择概述 145
7.3.2流特征产生方法 147
7.4基于模糊分类方法的网络流量分类器构建 148
7.4.1分类器构建 149
7.4.2分类器性能评测 151
7.5实验分析 153
7.5.1特征选择实验 154
7.5.2分类实验 156
8结论及进一步的工作 159
8.1结论 159
8.2进一步的工作 161
参考文献 163
图目录 3
图1.1模糊划分(a)格状划分(b)树状划分(c)散状划分 3
图1.2输入空间映射到特征空间的模式分布 5
图2.1两种模糊集隶属函数(a)高斯型(b)三角形 13
图2.2(a)梯形隶属函数(b)Don’t care隶属函数 14
图2.3一个超盒体分类器的分类模糊区域视图 16
图2.4模糊划分例子(a)格状划分(b)散状划分 18
图2.5最优分类超平面 24
图3.1特征空间中的一超球 37
图3.2超圆锥体隶属函数空间示意图 39
图3.3特征空间中多类超球关系 42
图3.4训练模式分布与隶属函数关系 43
图3.5δm边界下界分析 44
图3.6δm边界上界分析 45
图3.7被错误分类模式的δm边界分析 47
图3.8δm的调整示图 49
图3.9不相交叠的相邻规则的边界最优化分析 49
图3.10核函数及参数与分类模型影响分析图 51
图4.1支持向量聚类示意图 56
图4.2支持向量聚类的例子 58
图4.3参数q与边界关系 59
图4.4多超球核聚类示意图 61
图4.5分类模型构建流程图 61
图4.6规则区域空间示意图 63
图4.7进化式核聚类示例 67
图4.8δmj的变化与隶属度之间关系 69
图4.9染色体及个体的组成 70
图4.10种群的组成 70
图5.1One-against-a11方法中的不可分区域(1) 77
图5.2One-against-all方法中的不可分区域(2) 78
图5.3One-against-one方法中的不可分区域 78
图5.4扩展后的可预测区域 78
图5.5模糊划分示例 81
图5.6模糊子集对应隶属函数示意图 82
图5.7xj轴上的隶属函数 84
图5.84种隶属函数 87
图5.9双螺旋线分类 89
图5.10支持向量与隶属函数关系图 90
图5.11δ与相似度及识别率的关系 95
图5.12双螺旋线模式分布图 100
图5.13δ、C与识别率、规则数之间关系图 100
图6.1分类器集成方式 105
图6.2分类器集成系统构建流程 112
图6.3两个分类器在同一数据集上的错分情况 115
图6.4分类器集识别率与差异度关系 123
图7.1分类器构建的过程图 133
图7.2网络流量数据采集示意图 134
图7.3LibPcap(*.dmp)文件格式 135
图7.4LibPcap报文格式 135
图7.5报文成形的流示意图 136
图7.6流的在前向包个数上的分布图 137
图7.7流时间特征示意图 137
图7.8网络流在持续时间上的分布图 138
图7.9流的前向报文推送比特位的个数分布图 138
图7.10网络流样本自动标志过程 144
图7.11基于核聚类的模糊分类器构建过程 150
图7.12基于SVM的模糊分类器构建过程 151
图7.13分类器评测过程 152
图7.14特征J(x)的分布图 155
图7.15分类器性能比较图 157
表目录 16
表2.1模糊区域划分方式比较 16
表3.1不同的核函数及参数实验结果比较 51
表3.2实验数据集情况表 52
表3.3不同数据集的实验结果 52
表4.1FCMBEKC模型实验结果(wine数据集) 73
表4.2FCMBEKC方法与文献[76]方法的实验结果比较 74
表4.3FCMBEKC模型实验结果(手写体数字识别数据集) 75
表4.4不同方法的识别率比较 75
表5.1双螺旋线分类实验结果 89
表5.2采用不同隶属函数的分类结果比较 101
表5.3其他方法在Image数据集上的错误识别率 101
表5.4多类分类实验比较(Iris数据集) 102
表6.1两个分类器的错分表 115
表6.2个体分类器的识别率及参数 117
表6.3个体分类器的错分表 117
表6.4基于Iris数据集的一分类器隶属度矩阵 120
表6.5分类集成系统与个体分类器识别率比较 124
表6.6分类器集成方法与其他集成方法识别率的比较 125
表7.1网络流的候选特征集 139
表7.2Internet上流行的应用 140
表7.3常见的网络应用及其特征码 142
表7.4列联表示例 152
表7.5流量应用类型 153
表7.6通过捕获报文而得到的数据集 153
表7.7J(x)值较大的10个特征 156
表7.8遗传算法每次迭代后的分类精确率 156
表7.9分类器性能比较 157
表7.10P2P流量分类结果 158