智能数据挖掘 面向不确定数据的频繁模式PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:于晓梅,王红著
- 出 版 社:北京:清华大学出版社
- 出版年份:2018
- ISBN:9787302499855
- 页数:162 页
第1章 不确定频繁模式挖掘概述 1
1.1 不确定数据挖掘 1
1.2 不确定频繁模式挖掘研究背景 2
1.3 相关工作 5
1.3.1 完整的频繁项集挖掘 6
1.3.2 频繁闭项集挖掘 8
1.3.3 最大频繁项集挖掘 9
1.3.4 Top-k频繁模式挖掘 10
1.3.5 近似频繁模式挖掘 11
1.4 研究内容与本书贡献 12
1.4.1 研究内容 12
1.4.2 本书贡献 13
1.5 本书结构 15
第2章 不确定频繁模式挖掘技术 17
2.1 数据不确定性的原因 17
2.2 可能性世界理论和概率数据库 18
2.3 不确定频繁项集挖掘 19
2.3.1 基于概率数据的不确定数据模型 20
2.3.2 基于水平数据格式的挖掘方法 21
2.3.3 基于垂直数据格式的挖掘方法 22
2.4 不确定序列模式挖掘 24
2.4.1 不确定序列数据模型 25
2.4.2 不确定序列模式挖掘技术 28
2.5 不确定频繁子图模式挖掘 32
2.5.1 不确定图数据模型 33
2.5.2 不确定频繁子图模式挖掘技术 37
2.6 不确定高效用项集挖掘 41
2.6.1 不确定高效用数据模型 41
2.6.2 不确定高效用项集挖掘技术 44
2.7 不确定加权频繁项集挖掘 46
2.7.1 不确定加权数据模型 47
2.7.2 不确定加权频繁项集挖掘技术 48
2.8 本章小结 52
第3章 Eclat框架下基于支持度的双向排序策略 53
3.1 基于垂直数据格式的Eclat算法 53
3.1.1 存在的问题 53
3.1.2 支持度性质及证明 54
3.2 基于支持度排序的双向处理策略 56
3.2.1 支持度升序排列阶段 56
3.2.2 支持度降序排列阶段 57
3.2.3 频繁项集挖掘中的双向处理策略 57
3.2.4 Bi-Eclat算法 58
3.2.5 Bi-Eclat算法示例 59
3.3 概率频繁模式挖掘中的双向排序策略 61
3.3.1 基于概率数据的不确定频繁模式挖掘 61
3.3.2 基于概率频度的双向排序策略 64
3.4 实验结果及分析 65
3.4.1 实验数据集 65
3.4.2 实验结果分析 67
3.5 本章小结 76
第4章 Eclat框架下的概率频繁项集挖掘算法 77
4.1 概率频繁项集挖掘相关概念 77
4.2 概率频繁项集精确挖掘算法 79
4.2.1 相关工作 80
4.2.2 Tidlist数据结构 81
4.2.3 概率频度计算模块 81
4.2.4 UBEclat算法 83
4.3 概率频繁项集近似挖掘算法 85
4.3.1 近似挖掘理论基础 85
4.3.2 近似挖掘相关工作 86
4.3.3 NDUEclat算法 88
4.4 实验结果及分析 89
4.4.1 实验数据集 90
4.4.2 正态分布数据集中的性能分析 90
4.4.3 长尾分布数据集中的性能分析 92
4.5 本章小结 95
第5章 基于粗糙集理论的近似频繁模式挖掘 96
5.1 容错数据中的频繁模式挖掘理论 96
5.1.1 容错数据模型 96
5.1.2 容错数据的挑战 96
5.1.3 粗糙集理论及相关概念 99
5.1.4 粗糙集理论在数据挖掘中的应用 99
5.2 面向容错数据的近似频繁模式挖掘 101
5.2.1 事务信息系统构建阶段 101
5.2.2 等价类生成阶段 103
5.2.3 下近似和上近似的定义 104
5.2.4 近似频繁模式挖掘阶段 106
5.2.5 精确度和覆盖度的定义 108
5.3 实验结果及分析 109
5.3.1 模拟数据集上的性能分析 109
5.3.2 真实数据集上的性能分析 111
5.4 本章小结 115
第6章 在传统中医药数据集中挖掘Top-k近似频繁闭模式 116
6.1 相关工作 116
6.1.1 面临的问题 117
6.1.2 近似频繁模式挖掘算法 118
6.2 基于粗糙集理论的Top-k近似频繁闭模式挖掘 123
6.2.1 事务类划分阶段 124
6.2.2 核模式产生阶段 126
6.2.3 Top-k近似频繁闭模式挖掘阶段 129
6.3 实验结果和分析 131
6.3.1 基于支持度的聚类算法性能分析 131
6.3.2 Top-k近似频繁闭模式挖掘算法性能分析 135
6.3.3 实验结果分析 138
6.4 本章小结 138
第7章 总结和展望 140
7.1 本书总结 140
7.2 研究展望 141
参考文献 143
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《面向可持续发展的马克思主义经济科学研究》刘正刚,李晓,田军著 2018
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019