第1章 绪论 1
1.1 背景和意义 1
1.2 国内外研究现状 2
1.2.1 传统数据集中频繁模式挖掘算法的研究 2
1.2.2 不确定数据集中的频繁模式挖掘算法的研究 6
1.2.3 高效用项集挖掘算法的研究 11
1.2.4 大数据集下的频繁模式挖掘研究 17
第2章 传统事务数据集中的频繁模式挖掘算法 19
2.1 引言 19
2.2 传统数据集中频繁模式挖掘的典型算法 19
2.2.1 Apriori算法 19
2.2.2 FP-Growth算法 20
2.2.3 COFI算法 23
2.3 基于滑动窗口的数据流频繁模式挖掘算法 26
2.3.1 相关定义及问题描述 26
2.3.2 算法描述 28
2.3.3 算法分析 32
2.3.4 实验及结果分析 34
2.4 本章小结 36
第3章 不确定数据集上的频繁模式挖掘算法 38
3.1 引言 38
3.2 不确定静态数据集上频繁模式挖掘算法 39
3.2.1 相关定义与问题描述 39
3.2.2 AT-Mine算法 41
3.2.3 算法分析 48
3.2.4 实验及结果分析 48
3.3 基于滑动窗口的不确定数据流的频繁模式挖掘算法 56
3.3.1 相关定义与问题描述 56
3.3.2 UDS-FIM算法 56
3.3.3 实验及结果对比分析 66
3.4 带权重值的不确定数据流上的频繁模式挖掘模型 73
3.4.1 相关定义与问题描述 74
3.4.2 基于权重的频繁模式模型描述 74
3.4.3 基于权重的频繁模式挖掘算法 75
3.4.4 具有权重值的不确定数据流的频繁模式挖掘算法 80
3.4.5 实验及结果分析 80
3.5 本章小结 82
第4章 高效用模式挖掘算法 84
4.1 引言 84
4.2 一种不产生候选项集的高效用模式挖掘算法 84
4.2.1 相关定义与问题描述 85
4.2.2 TNT-HUI算法 86
4.2.3 算法分析 93
4.2.4 实验及结果对比分析 94
4.3 数据流的高效用模式挖掘算法 101
4.3.1 问题描述 102
4.3.2 HUM-UT算法 102
4.3.3 实验及结果分析 110
4.4 本章小结 115
第5章 大数据集上的频繁模式挖掘算法 116
5.1 引言 116
5.2 相关定义 116
5.3 一种高效的基于MapReduce的频繁模式挖掘算法 117
5.4 大数据集上的数据流频繁模式挖掘算法 120
5.5 算法分析 121
5.6 实验及结果分析 122
5.6.1 不同最小支持度下的运行时间对比 123
5.6.2 不同数据量下的运行时间对比 124
5.6.3 加速度对比实验 125
5.7 本章小结 125
参考文献 127