《智能数据挖掘 面向不确定数据的频繁模式》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:于晓梅,王红著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2018
  • ISBN:9787302499855
  • 页数:162 页
图书介绍:不确定数据广泛存在于各种应用,人们对数据不确定性的认识逐渐深入。本书全面梳理和总结了不确定数据频繁模式挖掘领域取得的主要研究成果,从数据模型、问题定义、常用算法等方面系统介绍了不确定频繁项集挖掘、不确定图数据挖掘、不确定序列模式挖掘、不确定加权频繁模式挖掘以及不确定高效用频繁模式挖掘、容错频繁模式挖掘等,力图给研究人员提供一个了解不确定频繁模式挖掘的严谨、易懂的学术读物。

第1章 不确定频繁模式挖掘概述 1

1.1 不确定数据挖掘 1

1.2 不确定频繁模式挖掘研究背景 2

1.3 相关工作 5

1.3.1 完整的频繁项集挖掘 6

1.3.2 频繁闭项集挖掘 8

1.3.3 最大频繁项集挖掘 9

1.3.4 Top-k频繁模式挖掘 10

1.3.5 近似频繁模式挖掘 11

1.4 研究内容与本书贡献 12

1.4.1 研究内容 12

1.4.2 本书贡献 13

1.5 本书结构 15

第2章 不确定频繁模式挖掘技术 17

2.1 数据不确定性的原因 17

2.2 可能性世界理论和概率数据库 18

2.3 不确定频繁项集挖掘 19

2.3.1 基于概率数据的不确定数据模型 20

2.3.2 基于水平数据格式的挖掘方法 21

2.3.3 基于垂直数据格式的挖掘方法 22

2.4 不确定序列模式挖掘 24

2.4.1 不确定序列数据模型 25

2.4.2 不确定序列模式挖掘技术 28

2.5 不确定频繁子图模式挖掘 32

2.5.1 不确定图数据模型 33

2.5.2 不确定频繁子图模式挖掘技术 37

2.6 不确定高效用项集挖掘 41

2.6.1 不确定高效用数据模型 41

2.6.2 不确定高效用项集挖掘技术 44

2.7 不确定加权频繁项集挖掘 46

2.7.1 不确定加权数据模型 47

2.7.2 不确定加权频繁项集挖掘技术 48

2.8 本章小结 52

第3章 Eclat框架下基于支持度的双向排序策略 53

3.1 基于垂直数据格式的Eclat算法 53

3.1.1 存在的问题 53

3.1.2 支持度性质及证明 54

3.2 基于支持度排序的双向处理策略 56

3.2.1 支持度升序排列阶段 56

3.2.2 支持度降序排列阶段 57

3.2.3 频繁项集挖掘中的双向处理策略 57

3.2.4 Bi-Eclat算法 58

3.2.5 Bi-Eclat算法示例 59

3.3 概率频繁模式挖掘中的双向排序策略 61

3.3.1 基于概率数据的不确定频繁模式挖掘 61

3.3.2 基于概率频度的双向排序策略 64

3.4 实验结果及分析 65

3.4.1 实验数据集 65

3.4.2 实验结果分析 67

3.5 本章小结 76

第4章 Eclat框架下的概率频繁项集挖掘算法 77

4.1 概率频繁项集挖掘相关概念 77

4.2 概率频繁项集精确挖掘算法 79

4.2.1 相关工作 80

4.2.2 Tidlist数据结构 81

4.2.3 概率频度计算模块 81

4.2.4 UBEclat算法 83

4.3 概率频繁项集近似挖掘算法 85

4.3.1 近似挖掘理论基础 85

4.3.2 近似挖掘相关工作 86

4.3.3 NDUEclat算法 88

4.4 实验结果及分析 89

4.4.1 实验数据集 90

4.4.2 正态分布数据集中的性能分析 90

4.4.3 长尾分布数据集中的性能分析 92

4.5 本章小结 95

第5章 基于粗糙集理论的近似频繁模式挖掘 96

5.1 容错数据中的频繁模式挖掘理论 96

5.1.1 容错数据模型 96

5.1.2 容错数据的挑战 96

5.1.3 粗糙集理论及相关概念 99

5.1.4 粗糙集理论在数据挖掘中的应用 99

5.2 面向容错数据的近似频繁模式挖掘 101

5.2.1 事务信息系统构建阶段 101

5.2.2 等价类生成阶段 103

5.2.3 下近似和上近似的定义 104

5.2.4 近似频繁模式挖掘阶段 106

5.2.5 精确度和覆盖度的定义 108

5.3 实验结果及分析 109

5.3.1 模拟数据集上的性能分析 109

5.3.2 真实数据集上的性能分析 111

5.4 本章小结 115

第6章 在传统中医药数据集中挖掘Top-k近似频繁闭模式 116

6.1 相关工作 116

6.1.1 面临的问题 117

6.1.2 近似频繁模式挖掘算法 118

6.2 基于粗糙集理论的Top-k近似频繁闭模式挖掘 123

6.2.1 事务类划分阶段 124

6.2.2 核模式产生阶段 126

6.2.3 Top-k近似频繁闭模式挖掘阶段 129

6.3 实验结果和分析 131

6.3.1 基于支持度的聚类算法性能分析 131

6.3.2 Top-k近似频繁闭模式挖掘算法性能分析 135

6.3.3 实验结果分析 138

6.4 本章小结 138

第7章 总结和展望 140

7.1 本书总结 140

7.2 研究展望 141

参考文献 143