当前位置:首页 > 工业技术
数据挖掘及其应用研究
数据挖掘及其应用研究

数据挖掘及其应用研究PDF电子书下载

工业技术

  • 电子书积分:8 积分如何计算积分?
  • 作 者:郑继刚著
  • 出 版 社:昆明:云南大学出版社
  • 出版年份:2014
  • ISBN:9787548219569
  • 页数:102 页
图书介绍:本书,是一本专门讨论计算机科学领域的数据挖掘的书籍。全书集中讨论了现今数据挖掘方面的科学知识和相关应用。作者从数据挖掘的概念谈起,介绍了数据挖掘的发展历程及应用情况,之后又详细讨论了多种数据挖掘的常用方法,论证这些方法的实用性及发展前景。
《数据挖掘及其应用研究》目录

第1章 引 言 1

1.1 研究背景 1

1.1.1 空间数据挖掘 2

1.1.2 多媒体数据挖掘 2

1.1.3 时序数据挖掘 2

1.1.4 Web数据挖掘 3

1.1.5 不确定数据挖掘 3

1.2 研究内容及意义 4

1.2.1 国内外研究综述 4

1.2.2 关联规则挖掘问题的研究现状与成果 6

1.2.3 研究的意义 7

1.2.4 研究主要内容 7

1.3 数据挖掘概述 8

1.3.1 数据挖掘概念 8

1.3.2 数据挖掘的起源 8

1.3.3 数据挖掘的主要问题 9

1.3.4 数据挖掘的功能 9

1.4 数据挖掘的方法 10

1.5 数据挖掘面临的问题 12

1.5.1 挖掘方法和用户交互问题 13

1.5.2 性能问题 13

1.5.3 关于数据库类型的多样性问题 13

1.6 数据挖掘的发展趋势 13

1.7 研究展望 13

第2章 关联规则数据挖掘 15

2.1 关联规则概述 15

2.2 关联规则的分类 16

2.3 Apriori算法 17

2.3.1 算法描述 17

2.3.2 算法的性能瓶颈 19

2.3.3 算法的优化 19

2.4 FP-growth算法 20

2.4.1 算法描述 21

2.4.2 算法分析 23

第3章 基于关系代数的关联规则挖掘 24

3.1 关系代数的相关概念 24

3.1.1 传统的集合运算 24

3.1.2 专门的关系运算 27

3.2 基于关系代数的Apriori算法 31

3.2.1 算法的基本思想 32

3.2.2 算法分析 36

3.3 发现最大频繁项集和频繁闭项集 36

3.4 仿真实验及结果分析 38

3.4.1 实验环境和实验数据 38

3.4.2 算法性能比较 38

3.4.3 数据样本量对算法的影响 38

3.4.4 支持度对算法的影响 39

3.5 挖掘最大频繁项集和频繁闭项集 40

3.5.1 算法性能分析 41

3.5.2 去除冗余规则 41

第4章 聚类分析数据挖掘 42

4.1 聚类统计量 42

4.1.1 距 离 43

4.1.2 匹配系数 45

4.1.3 相似系数 46

4.2 系统聚类法 47

4.2.1 基本思想 47

4.2.2 系统聚类的方法 47

第5章 时间序列和序列模式挖掘 50

5.1 时间序列定义 50

5.2 时间序列预测的常用方法 51

5.2.1 确定性时间序列预测方法 51

5.2.2 随机时间序列预测方法 51

5.2.3 其他方法 51

5.3 时间序列的相似性搜索 51

5.3.1 时间序列相似性搜索 52

5.3.2 时间序列相似性查找 54

5.3.3 规范变换的查找方法 55

5.4 序列挖掘的基本方法 56

5.5 序列挖掘的算法 58

5.5.1 AprioriAll算法 58

5.5.2 AprioriSome算法 59

5.5.3 GSP算法 61

第6章 数据挖掘在网络入侵检测中的应用 62

6.1 网络入侵检测数据集 63

6.1.1 MIT LL数据集 63

6.1.2 KDD CUP99数据集 63

6.2 Weka数据挖掘应用研究 66

6.2.1 Weka简介 66

6.2.2 数据转换 66

6.3 Weka拒绝服务攻击关联分析 67

6.3.1 数据预处理 67

6.3.2 关联规则分析 68

6.3.3 关联规则挖掘系统设计 70

6.4 Excel关联规则挖掘 72

6.5 拒绝服务攻击聚类分析 77

6.5.1 聚类分析简介 77

6.5.2 数据预处理 77

6.5.3 K-Means算法 79

6.5.4 数据聚类分析 79

6.6 拒绝服务攻击序列模式挖掘 80

6.6.1 序列模式的概念 80

6.6.2 序列模式算法 81

6.6.3 数据预处理 82

6.6.4 序列模式挖掘 83

第7章 其他应用研究 84

7.1 鸢尾花数据挖掘 84

7.2 茶叶病虫害预警中的研究和应用 85

7.2.1 数据预处理 86

7.2.2 关联规则挖掘 87

7.3 农村居民消费结构和水平的聚类分析 88

7.3.1 我国农村居民消费情况的直观数值 88

7.3.2 我国农村居民消费结构的聚类分析 89

7.4 多媒体图像挖掘的关联规则挖掘 93

7.4.1 多媒体数据挖掘 93

7.4.2 多媒体图像关联规则挖掘 94

7.4.3 多媒体图像关联规则解析 96

参考文献 97

后记 102

返回顶部