第1章 导论 1
1.1 数据挖掘技术的源起与发展 1
1.2 数据挖掘的概念 2
1.3 数据挖掘的过程 4
1.4 数据挖掘的功能 5
1.5 数据挖掘的典型应用领域 6
1.6 目前国际上流行的数据挖掘软件 7
参考文献 7
第2章 数据预处理 8
2.1 数据清理 8
2.2 数据集成 14
2.3 数据转换 20
2.4 数据约简 22
参考文献 22
第3章 维约简——特征选择与特征提取 24
3.1 特征选择 24
3.2 特征提取 39
3.3 基于谱分析的降维框架 59
参考文献 75
第4章 关联规则提取与粗糙集 80
4.1 基本概念 80
4.2 经典的关联规则挖掘算法 81
4.3 模糊关联规则的发现 82
4.4 数量属性关联规则的挖掘 83
4.5 面向不确定知识的关联规则挖掘——粗糙集理论与应用 86
4.6 基于粗糙集和微粒群算法的特征选择(PSORSFS) 91
4.7 基于有序PSO的粗糙集近似熵约简 100
4.8 基于模糊粗糙集的最近邻聚类分类算法 104
参考文献 109
第5章 分类原理与方法 113
5.1 一般概念 113
5.2 基于归纳的传统决策树方法 115
5.3 超平面决策树方法 118
5.4 复合式评价函数 120
5.5 模糊类别的决策树方法 123
5.6 基于模糊极小极大网络的模糊规则提取与分类 126
5.7 Linear Map(LMAP)方法与包容型数据 132
参考文献 133
第6章 统计学习理论与支持向量机 135
6.1 简介 135
6.2 统计学习理论的主要内容 136
6.3 支持向量机理论 143
6.4 基于测地距离的SVM分类算法 147
6.5 基于SOR(Successive Over Relaxation)的支持向量回归训练方法 155
参考文献 168
第7章 聚类分析 171
7.1 聚类的基本概念 171
7.2 常见聚类算法 173
7.3 特征空间属性加权模糊核聚类算法 179
7.4 基于信息理论的合作模糊聚类算法研究 188
7.5 基于密度和网格的子空间聚类算法 191
参考文献 196
第8章 数据挖掘在生物信息学中的应用 199
8.1 基于集成分类器的蛋白序列分析 199
8.2 聚类分析在基因表达数据中的应用 211
8.3 基于有监督聚类算法的蛋白三维结构分类 224
参考文献 228
第9章 数据挖掘在合金相图研究中的应用 233
9.1 国内外相图研究现状 233
9.2 相图研究的原子参数-数据挖掘方法 234
9.3 研究三元合金系中间化合物形成规律的原理与方法 236
9.4 国内外相图研究现状:三元合金系中间化合物形成规律研究 237
参考文献 262