第1章 绪论 1
1.1 数据挖掘 1
1.1.1 数据挖掘的基本概念 1
1.1.2 数据挖掘的任务 5
1.1.3 数据挖掘的方法 8
1.1.4 数据挖掘的应用 10
1.1.5 数据挖掘的研究方向 10
1.2 概念格 11
1.2.1 概念格的基本概念 11
1.2.2 概念格的研究内容 13
1.2.3 概念格的研究方向 15
第2章 加权概念格的权值获取及其拓展格结构 17
2.1 引言 17
2.2 加权概念格的基本定义 18
2.3 基于信息熵和偏差的内涵权值获取 21
2.3.1 基于信息熵的单属性内涵权值自动获取 22
2.3.2 内涵重要性偏差及多属性内涵权值的获取 23
2.4 加权概念格的拓展结构 24
2.4.1 频繁加权概念格及其相关定理 24
2.4.2 强加权概念格及其相关定理 24
2.5 实例分析 25
2.6 小结 28
第3章 频繁加权概念格的代数结构及其知识提取的完备性 29
3.1 引言 29
3.2 概念格的完备性 30
3.3 虚概念及频繁加权概念格的完备性 30
3.3.1 虚概念 31
3.3.2 频繁加权概念格的完备性 34
3.4 频繁加权概念格的代数结构 37
3.4.1 相关定义及算子 37
3.4.2 代数性质 38
3.5 频繁加权概念格知识提取的完备性 42
3.6 小结 43
第4章 加权概念格的构造方法 45
4.1 引言 45
4.2 频繁加权概念格的渐进式构造 46
4.2.1 构造方法 46
4.2.2 构造算法 47
4.2.3 算法分析 48
4.2.4 实例分析 49
4.3 频繁加权概念格的批处理构造 51
4.3.1 基本定义 51
4.3.2 构造方法 53
4.3.3 实例分析 55
4.3.4 构造算法 57
4.3.5 算法分析 59
4.3.6 实验结果与分析 59
4.4 强加权概念格的渐进式构造 61
4.5 强加权概念格的批处理构造 62
4.5.1 构造方法 62
4.5.2 构造算法 63
4.5.3 实验结果及分析 64
4.6 小结 65
第5章 加权概念格在图像语义自动标注中的应用 67
5.1 引言 67
5.2 图像语义自动标注与BOV模型 68
5.2.1 图像语义自动标注 68
5.2.2 图像语义自动标注的研究现状 69
5.2.3 BOV模型 75
5.3 基于频繁加权概念格的视觉词典生成与场景分类方法 78
5.3.1 算法思想 78
5.3.2 算法描述 80
5.3.3 举例 82
5.4 实验结果分析 84
5.4.1 视觉词典大小对分类性能的影响 85
5.4.2 归一化阈值对分类性能的影响 86
5.4.3 外延数阈值对分类性能的影响 86
5.5 小结 88
第6章 加权概念格在天体光谱数据挖掘中的应用 91
6.1 引言 91
6.2 面向LAMOST的天体光谱数据挖掘技术 91
6.2.1 LAMOST项目简介 91
6.2.2 天体光谱数据挖掘技术 92
6.3 基于频繁加权概念格的加权关联规则提取方法 93
6.3.1 基本定义 93
6.3.2 基本思想 94
6.3.3 算法描述 94
6.4 基于频繁加权概念格的天体光谱关联知识挖掘系统 95
6.4.1 系统功能与体系结构 95
6.4.2 关键实现技术 98
6.4.3 运行结果与分析 99
6.5 小结 103
参考文献 105