《数据挖掘算法原理与实现》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:王振武编著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2017
  • ISBN:9787302454151
  • 页数:224 页
图书介绍:本教材首先分析数据挖掘各种算法原理,然后引入实例对数据挖掘算法的原理进行剖析,接着通过给出算法的源程序(非伪代码)让读者对数据挖掘算法有更加深入地理解,随后总结算法的优缺点使得读者更加清楚算法的特点,最后通过给出该算法的一系列应用场景,让读者更加清楚算法的应用背景。通过这一连串的讲解,读者对算法的理解将不仅仅停留在理论层面,而是更加深入和立体。

第1章 绪论 1

1.1 数据挖掘的概念 1

1.2 数据挖掘的历史及发展 1

1.3 数据挖掘的研究内容及功能 5

1.3.1 数据挖掘的研究内容 5

1.3.2 数据挖掘的功能 6

1.4 数据挖掘的常用技术及工具 9

1.4.1 数据挖掘的常用技术 9

1.4.2 数据挖掘的工具 12

1.5 数据挖掘的应用热点 12

1.6 小结 14

思考题 15

第2章 数据预处理 16

2.1 数据预处理的目的 16

2.2 数据清理 18

2.2.1 填充缺失值 18

2.2.2 光滑噪声数据 18

2.2.3 数据清理过程 19

2.3 数据集成和数据变换 20

2.3.1 数据集成 20

2.3.2 数据变换 21

2.4 数据归约 23

2.4.1 数据立方体聚集 23

2.4.2 维归约 23

2.4.3 数据压缩 24

2.4.4 数值归约 25

2.4.5 数据离散化与概念分层 28

2.5 特征选择与提取 30

2.5.1 特征选择 30

2.5.2 特征提取 31

2.6 小结 33

思考题 33

第3章 关联规则挖掘 35

3.1 基本概念 35

3.2 关联规则挖掘算法——Apriori算法原理 36

3.3 Apriori算法实例分析 38

3.4 Apriori算法源程序分析 41

3.5 Apriori算法的特点及应用 50

3.5.1 Apriori算法特点 50

3.5.2 Apriori算法应用 51

3.6 小结 52

思考题 52

第4章 决策树分类算法 54

4.1 基本概念 54

4.1.1 决策树分类算法概述 54

4.1.2 决策树基本算法概述 54

4.2 决策树分类算法——ID3算法原理 56

4.2.1 ID3算法原理 56

4.2.2 熵和信息增益 57

4.2.3 ID3算法 59

4.3 ID3算法实例分析 60

4.4 ID3算法源程序分析 64

4.5 ID3算法的特点及应用 72

4.5.1 ID3算法特点 72

4.5.2 ID3算法应用 72

4.6 决策树分类算法——C4.5算法原理 73

4.6.1 C4.5 算法 73

4.6.2 C4.5 算法的伪代码 75

4.7 C4.5 算法实例分析 76

4.8 C4.5 算法源程序分析 77

4.9 C4.5 算法的特点及应用 101

4.9.1 C4.5 算法特点 101

4.9.2 C4.5 算法应用 101

4.10 小结 102

思考题 102

第5章 贝叶斯分类算法 103

5.1 基本概念 103

5.1.1 主观概率 103

5.1.2 贝叶斯定理 104

5.2 贝叶斯分类算法原理 105

5.2.1 朴素贝叶斯分类模型 105

5.2.2 贝叶斯信念网络 107

5.3 贝叶斯算法实例分析 110

5.3.1 朴素贝叶斯分类器 110

5.3.2 BBN 112

5.4 贝叶斯算法源程序分析 114

5.5 贝叶斯算法特点及应用 119

5.5.1 朴素贝叶斯分类算法 119

5.5.2 贝叶斯信念网 120

思考题 121

第6章 人工神经网络算法 122

6.1 基本概念 122

6.1.1 生物神经元模型 122

6.1.2 人工神经元模型 123

6.1.3 主要的神经网络模型 124

6.2 BP算法原理 126

6.2.1 Delta学习规则的基本原理 126

6.2.2 BP网络的结构 126

6.2.3 BP网络的算法描述 127

6.2.4 标准BP网络的工作过程 129

6.3 BP算法实例分析 130

6.4 BP算法源程序分析 134

6.5 BP算法的特点及应用 143

6.5.1 BP算法特点 143

6.5.2 BP算法应用 144

6.6 小结 145

思考题 145

第7章 支持向量机 146

7.1 基本概念 146

7.1.1 支持向量机理论基础 146

7.1.2 统计学习核心理论 146

7.1.3 学习过程的一致性条件 146

7.1.4 函数集的VC维 147

7.1.5 泛化误差界 148

7.1.6 结构风险最小化归纳原理 148

7.2 支持向量机原理 149

7.2.1 支持向量机核心理论 149

7.2.2 最大间隔分类超平面 149

7.2.3 支持向量机 150

7.2.4 核函数分类 153

7.3 支持向量机实例分析 154

7.4 支持向量机的特点及应用 156

7.4.1 支持向量机的特点 156

7.4.2 支持向量机的应用 157

7.5 小结 158

思考题 158

第8章 K-means聚类算法 159

8.1 简介 159

8.2 K-means聚类算法原理 159

8.3 K-means聚类算法实例分析 161

8.4 K-means聚类算法源程序分析 164

8.5 K-means聚类算法的特点及应用 171

8.5.1 K-means聚类算法的特点 171

8.5.2 K-means聚类算法的应用 171

8.6 小结 172

思考题 172

第9章 K-中心点聚类算法 173

9.1 简介 173

9.2 K-中心点聚类算法原理 173

9.3 K-中心点聚类算法实例分析 174

9.4 K-中心点聚类算法源程序分析 175

9.5 K-中心点聚类算法的特点及应用 183

9.5.1 K-中心点聚类算法的特点 183

9.5.2 K-中心点聚类算法的应用 183

9.6 小结 183

第10章 神经网络聚类方法:SOM 184

10.1 简介 184

10.2 竞争学习算法基础 184

10.2.1 自组织神经网络结构 184

10.2.2 自组织神经网络的原理 185

10.3 SOM算法原理 187

10.3.1 SOM网络的拓扑结构 187

10.3.2 SOM权值调整域 188

10.3.3 SOM网络运行原理 189

10.3.4 学习方法 189

10.4 SOM算法实例分析 190

10.4.1 问题描述 190

10.4.2 网络设计及学习结果 191

10.4.3 结果输出 191

10.5 SOM算法源程序分析 192

10.6 SOM算法的特点及应用 202

10.6.1 SOM特点 202

10.6.2 SOM应用 202

10.7 小结 203

思考题 203

第11章 数据挖掘的发展 204

11.1 Web挖掘 204

11.1.1 Web数据挖掘定义 204

11.1.2 Web数据挖掘分类 204

11.1.3 Web数据挖掘的数据源 206

11.1.4 Web数据挖掘中知识的分类 207

11.1.5 Web数据挖掘的关键问题 208

11.2 空间数据挖掘 209

11.2.1 空间数据挖掘的定义与特点 209

11.2.2 空间数据挖掘的体系结构 210

11.2.3 空间数据挖掘可获得的知识类型 210

11.2.4 空间数据挖掘的方法 212

11.3 流数据挖掘 215

11.3.1 流数据的特点 215

11.3.2 流数据挖掘关键技术 215

11.3.3 流数据挖掘的实际应用及前景 217

11.4 数据挖掘与可视化技术 218

11.4.1 什么是可视化 218

11.4.2 数据可视化技术分类 219

11.4.3 数据挖掘可视化技术的应用 221

11.5 小结 222

思考题 223

参考文献 224