《数据挖掘技术》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:王小妮著
  • 出 版 社:北京:北京航空航天大学出版社
  • 出版年份:2014
  • ISBN:9787512413764
  • 页数:229 页
图书介绍:本书是基于数据挖掘经典算法及数据挖掘领域最新研究技术领域进行分析的教材。全书内容包括数据挖掘概述、分类算法、聚类算法、关联规则算法及相应典型算法的算法描述及分析等。同时,对当前数据挖掘的新技术:流数据挖掘技术、高维聚类算法、分布式数据挖掘、物联网数据挖掘进行了详细的介绍,该部分在讲述基本概念及典型算法的基础上配有新研究的算法模型及分析,并具有实验数据分析及结果显示。本书最后对其它数据挖掘新技术包括业务活动监控挖掘技术、云计算平台架构及数据挖掘方法及思维流程数据挖掘技术进行了描述。

第1章 数据挖掘概述 1

1.1数据挖掘的概念 1

1.1.1 KDD与数据挖掘 1

1.1.2数据挖掘过程 3

1.1.3数据挖掘任务 4

1.2数据挖掘的发展历程 5

1.3数据挖掘的分类 7

1.4数据挖掘的研究方法 8

1.4.1统计分析方法 8

1.4.2决策树方法 9

1.4.3模糊集方法 10

1.4.4粗糙集方法 11

1.4.5人工神经网络方法 12

1.4.6遗传算法 13

1.5国内外数据挖掘研究现状 14

本章小结 15

参考文献 15

第2章 分类算法分析 17

2.1分类概念 17

2.2分类方法 18

2.3决策树算法 20

2.3.1 ID3算法 22

2.3.2 C4.5算法 23

2.4贝叶斯分类 24

2.5粗糙集方法 26

2.5.1粗糙集模型扩展 26

2.5.2粗糙集与其他不确定信息处理理论的关系 27

2.6遗传算法 28

2.7其他分类算法 29

本章小结 30

参考文献 30

第3章 聚类算法分析 32

3.1聚类分析概述 32

3.1.1聚类分析概念 32

3.1.2聚类分析中的数据类型 33

3.2聚类分类 37

3.3划分方法 39

3.3.1 K-means算法 39

3.3.2 K-medoid算法 40

3.4层次方法 41

3.4.1 BIRCH算法 41

3.4.2 CURE算法 42

3.5密度方法 43

3.5.1 DBSCAN算法 43

3.5.2 OPTICS算法 44

3.6网格方法 46

3.6.1 STING算法 46

3.6.2 Wavecluster算法 46

3.7基于标量化Ⅲ的聚类统计算法 46

3.7.1数学描述 47

3.7.2计算方法 49

3.7.3文本数据 49

3.7.4应用实例 49

3.8其他聚类算法 54

本章小结 55

参考文献 55

第4章 关联规则算法分析 57

4.1关联规则概念 57

4.2频繁模式挖掘 59

4.2.1 Apriori算法 60

4.2.2 FP-Growth算法 61

4.2.3DHP算法 63

4.2.4DIC算法 63

4.3序列模式挖掘 64

4.3.1序列模式挖掘的相关概念 64

4.3.2基于Apriori的序列模式挖掘算法 65

4.3.3基于序列模式增长的序列模式挖掘算法 66

4.4其他关联规则算法 68

4.4.1并行Apriori-like算法 68

4.4.2并行FP-Growth算法 70

本章小结 70

参考文献 70

第5章 流数据挖掘技术 73

5.1流数据挖掘技术概述 73

5.1.1流数据概念 73

5.1.2流数据模型 74

5.1.3流数据挖掘算法特点 75

5.2流数据挖掘技术分类 78

5.2.1概要数据结构 78

5.2.2滑动窗口技术 80

5.2.3多窗口和衰减因子技术 80

5.2.4近似技术、自适应技术和子空间技术 81

5.3流数据聚类算法 82

5.3.1 CluStream算法 83

5.3.2 STREAM算法 85

5.3.3 D-Stream算法 86

5.3.4GSCDS算法 87

5.3.5 HCIuStream算法 87

5.4流数据频繁项集挖掘算法 88

5.4.1 FPN算法 89

5.4.2NEC算法 90

5.4.3Kaal算法 91

5.5流数据分类算法 93

5.5.1 VFDT算法 93

5.5.2 CVFDT算法 94

5.6多数据流挖掘算法 95

5.7实时数据流挖掘技术 96

5.7.1实时数据挖掘概述 97

5.7.2实时数据挖掘方法 97

5.7.3实时数据挖掘框架 99

5.7.4实时数据挖掘模型 100

5.7.5实时数据挖掘技术分类 101

5.8流数据聚类演化分析 103

5.9流数据挖掘新技术研究 105

本章小结 106

参考文献 107

第6章 高维聚类算法 111

6.1高维聚类算法概述 111

6.1.1高维聚类算法 111

6.1.2高维度数据处理方法 112

6.2高维数据流聚类分类 114

6.3维度对聚类算法精度的影响 116

6.3.1维度对数据对象间距离的影响 117

6.3.2维度对算法聚类精度的影响 118

6.3.3传统方法降维实验 119

6.4混合类型属性聚类算法 120

6.4.1混合类型属性的处理 121

6.4.2 UCI数据集实验分析 121

6.4.3流数据实验分析 126

6.5基于复相关系数倒数的降维 131

6.5.1复相关系数 131

6.5.2复相关系数倒数加权 132

6.5.3降维实验分析 133

本章小结 138

参考文献 138

第7章 分布式数据挖掘 140

7.1分布式数据挖掘概述 140

7.2分布式聚类算法 143

7.2.1分布式聚类算法分析 143

7.2.2分布式K-means聚类算法 145

7.2.3分布式聚类算法K-DMeans 147

7.2.4分布式聚类算法DK-Means 148

7.3 DRA-Kmeans聚类算法 149

7.3.1 DRA-Kmeans聚类算法相关技术 149

7.3.2 DRA-Kmeans局部聚类算法 154

7.3.3 DRA-Kmeans全局聚类算法 156

7.4分布式数据挖掘新技术研究 160

本章小结 160

参考文献 160

第8章 物联网数据挖掘 162

8.1物联网数据挖掘概述 162

8.2物联网数据挖掘技术分类 166

8.2.1物联网环境下基于分类的数据挖掘方法 166

8.2.2物联网环境下基于关联规则的数据挖掘方法 167

8.2.3物联网环境下基于聚类分析的数据挖掘方法 167

8.2.4物联网环境下基于时间序列分析的数据挖掘方法 167

8.3无线传感器网络中的聚类算法 168

8.4 RA-Cluster算法 169

8.5物联网路由算法 171

8.5.1无线分布式网络及其路由协议 171

8.5.2物联网路由算法分析 174

8.5.3 RA-AODVjr算法原理 179

8.5.4 RA-AODVjr算法实验分析 185

8.6物联网数据挖掘新技术研究 192

本章小结 193

参考文献 193

第9章 数据挖掘新技术 195

9.1业务活动监控挖掘技术 195

9.1.1业务活动监控概述 195

9.1.2业务活动监控系统预测模型 199

9.1.3结构数据挖掘理论 201

9.2云计算平台架构及数据挖掘方法 204

9.2.1基于云计算的分布式数据挖掘平台架构 204

9.2.2基于云计算的分布式数据挖掘算法 215

9.3思维流程数据挖掘技术 220

9.3.1思维流程发现的基本思想 220

9.3.2思维流程发现的关键任务 224

9.3.3思维流程发现研究的关键问题 226

本章小结 228

参考文献 228