《数据挖掘算法研究与实现》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:李竹林,刘芬著
  • 出 版 社:北京:中国水利水电出版社
  • 出版年份:2017
  • ISBN:9787517053552
  • 页数:313 页
图书介绍:数据挖掘是一门面向应用的新兴学科分支。本书以各类数据挖掘算法为核心,对数据挖掘研究领域的主要理论和典型算法进行了研究,并注重国内外最新研究进展的融入,力求内容系统、全面、先进。本书主要内容包括数据挖掘中的数据预处理、数据的存储与数据仓库、关联规则挖掘算法、数据分类和预测挖掘算法、时间序列与序列模式挖掘算法的实现、数据聚类分析算法的实现、复杂类型的数据挖掘算法等。本书结构合理,条例清晰,内容丰富新颖,是一本值得学习研究的著作。

第1章 绪论 1

1.1 数据挖掘技术的产生与发展 1

1.2 数据挖掘的常用技术及工具 6

1.3 数据挖掘常用的知识表示模式与方法 7

1.4 数据挖掘的应用分析 8

第2章 数据挖掘中的数据预处理 13

2.1 数据预处理的目的 13

2.2 数据清理 16

2.3 数据集成和数据变换 23

2.4 数据归约 32

第3章 数据的存储与数据仓库 40

3.1 关系数据集 40

3.2 NoSQL数据库 42

3.3 分布式文件系统 45

3.4 数据仓库的体系结构 49

3.5 数据仓库的基本数据模型 54

3.6 联机分析处理(OLAP) 65

第4章 关联规则挖掘算法 79

4.1 关联规则算法概述 79

4.2 关联规则的基本算法 80

4.3 关联规则挖掘的其他算法 95

4.4 必要置信度对分类精度影响的研究 108

第5章 数据分类和预测挖掘算法 114

5.1 分类和预测概述 114

5.2 基于相似性的分类算法 116

5.3 决策树分类算法 120

5.4 贝叶斯分类算法 141

5.5 人工神经网络(ANN) 144

5.6 支持向量机 150

5.7 粗糙集与模糊集 159

5.8 预测和分类中的准确率、误差的度量 167

5.9 评估分类器或预测器的准确率 170

第6章 时间序列与序列模式挖掘算法的实现 173

6.1 时间序列挖掘概述 173

6.2 基于ARMA模型的序列匹配方法 177

6.3 基于离散傅里叶变换的时间序列相似性快速查找 180

6.4 序列挖掘及GSP算法 184

6.5 互联网信息流时间序列挖掘算法的实现 193

第7章 数据聚类分析算法的实现 199

7.1 聚类分析概述 199

7.2 划分聚类算法 203

7.3 层次聚类算法 215

7.4 密度聚类算法 227

7.5 网格聚类算法 234

7.6 模型聚类算法 239

7.7 孤立点分析 241

第8章 复杂类型的数据挖掘算法 243

8.1 文本数据挖掘 243

8.2 Web挖掘 257

8.3 空间数据挖掘 265

8.4 遗传算法 285

8.5 多媒体数据挖掘 293

8.6 可视化方法 302

参考文献 312