第1章 绪论 1
1.1 数据挖掘 1
1.1.1 产生和定义 2
1.1.2 挖掘的过程 3
1.1.3 挖掘的任务 4
1.1.4 挖掘的分类 6
1.1.5 面临的主要问题 6
1.1.6 主要应用 7
1.2 关联规则挖掘 8
1.2.1 关联规则的基本概念 9
1.2.2 关联规则挖掘的基本步骤 9
1.2.3 关联规则挖掘的基本方法 10
1.2.4 关联规则的应用 16
1.3 离群数据挖掘 18
1.3.1 离群数据挖掘的方法 19
1.3.2 离群数据挖掘的研究热点 24
1.3.3 离群数据挖掘的应用 25
第2章 关联规则挖掘方法及应用 28
2.1 基于准频繁项目集的关联规则挖掘 29
2.1.1 挖掘思想和算法 30
2.1.2 算法分析 32
2.2 基于背景知识的关联规则挖掘 34
2.2.1 问题的提出 34
2.2.2 面向关联规则挖掘的背景知识表示 35
2.2.3 基于背景知识的频繁模式挖掘 38
2.2.4 算法描述及实验分析 42
2.3 约束FP-tree及其构造方法 46
2.3.1 约束FP-tree 47
2.3.2 约束FP-tree的构造 48
2.3.3 约束FP-tree的构造算法 52
2.3.4 实验分析 53
2.3.5 相关工作的分析与比较 55
2.4 基于信息熵的加权频繁模式树构造算法 56
2.4.1 问题的提出 57
2.4.2 加权频繁项目集及加权关联规则 58
2.4.3 加权频繁模式树构的造算法 61
2.4.4 实验分析 63
2.5 关联规则挖掘在天体光谱中的应用 65
2.5.1 天体光谱分析 66
2.5.2 LAMOST望远镜简介 68
2.5.3 基于关联规则的恒星光谱数据相关性分析 71
2.5.4 约束频繁模式挖掘在天体光谱中的应用 78
2.5.5 加权频繁模式挖掘在天体光谱中的应用 83
第3章 离群数据挖掘方法及应用 90
3.1 基于距离支持度的离群数据挖掘 90
3.1.1 问题的提出 91
3.1.2 传统的最短距离系统聚类算法SL 92
3.1.3 基于距离的高维聚类离群数据挖掘算法DB-HDLO 92
3.1.4 DB-HDLO算法及分析 95
3.2 基于分阶段模糊聚类的离群数据挖掘 96
3.2.1 问题的提出 96
3.2.2 分阶段模糊聚类算法的思想 101
3.2.3 分阶段模糊聚类算法 104
3.2.4 实验分析 105
3.3 基于信息熵的离群数据挖掘 111
3.3.1 信息熵 112
3.3.2 算法描述 116
3.3.3 实验分析 118
3.4 基于特征属性子空间的离群数据挖掘 122
3.4.1 相关概念 122
3.4.2 算法描述 124
3.4.3 实验分析 125
3.5 离群数据挖掘在天体光谱中的应用 128
3.5.1 基于距离支持度的离群挖掘在天体光谱中的应用 128
3.5.2 基于信息熵的变星天体光谱快速识别方法 130
第4章 天体光谱数据的其他挖掘方法 134
4.1 天体光谱数据的正、负项目集挖掘 134
4.1.1 问题的提出 134
4.1.2 相关概念 135
4.1.3 含负项目的约束频繁模式树构造 136
4.1.4 算法思想及其方法描述 137
4.1.5 实验分析 139
4.2 基于约束概念格的恒星光谱分类规则提取算法 141
4.2.1 问题的引入 141
4.2.2 一般概念格与约束概念格 142
4.2.3 基于约束概念格的分类规则提取 143
4.2.4 基于约束概念格的分类规则提取算法 147
4.2.5 实验分析 148
4.3 一种恒星光谱分类规则后处理研究 151
4.3.1 问题的引入 152
4.3.2 恒星光谱分类规则 153
4.3.3 基于谓词逻辑的光谱分类后处理 153
4.3.4 实验分析 156
第5章 天体光谱数据挖掘原型系统 158
5.1 天体光谱关联规则挖掘系统 158
5.1.1 问题的引入 158
5.1.2 系统的功能及软件体系结构 159
5.1.3 系统的运行结果及分析 160
5.2 天体光谱离群数据挖掘系统 164
5.2.1 系统的功能及软件体系结构 164
5.2.2 系统的运行结果及分析 166
5.2.3 聚类 166
5.3 基于约束概念格的天体光谱分类规则挖掘系统 170
5.3.1 系统的功能及软件体系结构 170
5.3.2 关键技术 171
5.3.3 系统的运行结果及分析 173
参考文献 177