《数据流频繁模式挖掘及预测技术研究》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:陈辉著
  • 出 版 社:南昌:江西高校出版社
  • 出版年份:2010
  • ISBN:9787811329322
  • 页数:145 页
图书介绍:本书在研究与分析国内外关于流数据管理以及流数据挖掘现状的基础上,对数据流上滑动时间窗口内模式发现与数据预测技术进行了研究。研究了挖掘数据流上最近大小为N的时间窗口内频繁模式的方法、挖掘数据流上任意大小滑动时间窗口内频繁模式的方法、数据流滑动时间窗口内Top-k频繁模式挖掘的方法,本书还探讨了数据流上未来时间窗口内流数据的预测查询算法。

符号 1

1绪论 3

1.1 数据流产生背景 3

1.2 数据流的特点 4

1.3 数据流管理系统现状 5

1.4 数据流挖掘技术现状 7

1.4.1 数据流聚类技术现状 7

1.4.2 数据流分类技术现状 9

1.4.3 数据流频繁模式挖掘技术现状 10

1.4.4 流数据预测查询技术现状 12

1.5 数据流研究的意义 12

2数据流处理技术 15

2.1 数据流处理模型 15

2.2 数据流挖掘算法特点 17

2.3 常用数据流处理技术 17

2.3.1 抽样(Sampling) 18

2.3.2 小波方法(Wavelet) 19

2.3.3 梗概(Sketching) 20

2.3.4 直方图(Histogram) 22

2.2.5 概率统计(Probabilistic) 23

2.4 数据流时间窗口模型 24

2.4.1 快照式窗口(Snapshot Window) 24

2.4.2 界标式窗口(Landmark Window) 24

2.4.3 滑动式窗口(Sliding Window) 25

2.4.4 时间衰退(Damped Windows)模型 25

2.5 频繁模式挖掘方法 25

2.5.1 经典的静态集合的频繁模式挖掘方法 25

2.5.2 数据流频繁模式挖掘算法 27

2.6 滑动时间窗口频繁模式挖掘 28

2.6.1 主要挑战 28

2.6.2 基本概念 28

2.7 小结 30

3基于保守策略的频繁模式挖掘算法 31

3.1 引言 31

3.2 保守的频繁模式挖掘策略分析 33

3.2.1 流数据窗口 33

3.2.2 支持度计算策略 34

3.3 保守的频繁模式挖掘策略设计 35

3.3.1 RFP-tree结构设计 36

3.3.2 增量更新RFP-tree 37

3.3.3 RFP-tree树剪枝 38

3.3.4 频繁模式输出 44

3.4 实验分析 45

3.4.1 实验环境 45

3.4.2 基本性能分析 45

3.4.3 性能比较分析 47

3.5 小结 49

4基于衰减机制的频繁模式挖掘算法 50

4.1 引言 50

4.2 基于衰减策略的频繁模式挖掘算法分析 51

4.2.1 时间衰减模型 51

4.2.2 模型正确性分析 52

4.3 基于衰减策略的频繁模式挖掘算法设计 57

4.3.1 SW-tree结构设计 57

4.3.2 增量更新SW-tree 60

4.3.3 SW-tree剪枝 61

4.3.4 频繁模式输出 63

4.4 实验分析 65

4.4.1 实验环境 65

4.4.2 基本性能分析 66

4.4.3 性能比较分析 71

4.5 小结 74

5 Top-K频繁模式挖掘算法 76

5.1 引言 76

5.2 Top-K频繁模式挖掘算法分析 78

5.2.1 问题描述与思路 78

5.2.2 Chernoff边界理论 79

5.2.4 Top-k频繁模式挖掘 81

5.2.4 动态选择Supk 84

5.3 Top-K频繁模式挖掘算法设计 84

5.3.1 SWTP-tree结构设计 84

5.3.2 动态维护SWTP-tree 88

5.3.3 Top-k频繁模式输出 93

5.4 实验分析 95

5.4.1 实验环境 95

5.4.2 性能对比分析 96

5.5 小结 103

6基于马尔可夫模型的预测查询算法 104

6.1 引言 104

6.2 马尔科夫预测模型设计与分析 105

6.2.1 模型设计 106

6.2.2 模型分析 108

6.3 基于马尔可夫模型的预测算法设计 110

6.3.1 动态构建SSTD 111

6.3.2 数据预处理 112

6.3.3 基于马尔可夫模型的数据预测 115

6.4 实验分析 120

6.4.1 实验环境 120

6.4.2 基本性能分析 121

6.4.3 性能对比分析 126

6.5 小结 128

7总结与展望 129

7.1 本书总结 129

7.2 研究展望 131

主要参考文献 132