第1章 绪论 1
1.1 数据挖掘的概念 1
1.2 数据挖掘的历史及发展 1
1.3 数据挖掘的研究内容及功能 5
1.3.1 数据挖掘的研究内容 5
1.3.2 数据挖掘的功能 6
1.4 数据挖掘的常用技术及工具 9
1.4.1 数据挖掘的常用技术 9
1.4.2 数据挖掘的工具 12
1.5 数据挖掘的应用热点 12
1.6 小结 14
思考题 15
第2章 数据预处理 16
2.1 数据预处理的目的 16
2.2 数据清理 18
2.2.1 填充缺失值 18
2.2.2 光滑噪声数据 18
2.2.3 数据清理过程 19
2.3 数据集成和数据变换 20
2.3.1 数据集成 20
2.3.2 数据变换 21
2.4 数据归约 23
2.4.1 数据立方体聚集 23
2.4.2 维归约 23
2.4.3 数据压缩 24
2.4.4 数值归约 25
2.4.5 数据离散化与概念分层 28
2.5 特征选择与提取 30
2.5.1 特征选择 30
2.5.2 特征提取 31
2.6 小结 33
思考题 33
第3章 关联规则挖掘 35
3.1 基本概念 35
3.2 关联规则挖掘算法——Apriori算法原理 36
3.3 Apriori算法实例分析 38
3.4 Apriori算法源程序分析 41
3.5 Apriori算法的特点及应用 50
3.5.1 Apriori算法特点 50
3.5.2 Apriori算法应用 51
3.6 小结 52
思考题 52
第4章 决策树分类算法 54
4.1 基本概念 54
4.1.1 决策树分类算法概述 54
4.1.2 决策树基本算法概述 54
4.2 决策树分类算法——ID3算法原理 56
4.2.1 ID3算法原理 56
4.2.2 熵和信息增益 57
4.2.3 ID3算法 59
4.3 ID3算法实例分析 60
4.4 ID3算法源程序分析 64
4.5 ID3算法的特点及应用 72
4.5.1 ID3算法特点 72
4.5.2 ID3算法应用 72
4.6 决策树分类算法——C4.5算法原理 73
4.6.1 C4.5 算法 73
4.6.2 C4.5 算法的伪代码 75
4.7 C4.5 算法实例分析 76
4.8 C4.5 算法源程序分析 77
4.9 C4.5 算法的特点及应用 101
4.9.1 C4.5 算法特点 101
4.9.2 C4.5 算法应用 101
4.10 小结 102
思考题 102
第5章 贝叶斯分类算法 103
5.1 基本概念 103
5.1.1 主观概率 103
5.1.2 贝叶斯定理 104
5.2 贝叶斯分类算法原理 105
5.2.1 朴素贝叶斯分类模型 105
5.2.2 贝叶斯信念网络 107
5.3 贝叶斯算法实例分析 110
5.3.1 朴素贝叶斯分类器 110
5.3.2 BBN 112
5.4 贝叶斯算法源程序分析 114
5.5 贝叶斯算法特点及应用 119
5.5.1 朴素贝叶斯分类算法 119
5.5.2 贝叶斯信念网 120
思考题 121
第6章 人工神经网络算法 122
6.1 基本概念 122
6.1.1 生物神经元模型 122
6.1.2 人工神经元模型 123
6.1.3 主要的神经网络模型 124
6.2 BP算法原理 126
6.2.1 Delta学习规则的基本原理 126
6.2.2 BP网络的结构 126
6.2.3 BP网络的算法描述 127
6.2.4 标准BP网络的工作过程 129
6.3 BP算法实例分析 130
6.4 BP算法源程序分析 134
6.5 BP算法的特点及应用 143
6.5.1 BP算法特点 143
6.5.2 BP算法应用 144
6.6 小结 145
思考题 145
第7章 支持向量机 146
7.1 基本概念 146
7.1.1 支持向量机理论基础 146
7.1.2 统计学习核心理论 146
7.1.3 学习过程的一致性条件 146
7.1.4 函数集的VC维 147
7.1.5 泛化误差界 148
7.1.6 结构风险最小化归纳原理 148
7.2 支持向量机原理 149
7.2.1 支持向量机核心理论 149
7.2.2 最大间隔分类超平面 149
7.2.3 支持向量机 150
7.2.4 核函数分类 153
7.3 支持向量机实例分析 154
7.4 支持向量机的特点及应用 156
7.4.1 支持向量机的特点 156
7.4.2 支持向量机的应用 157
7.5 小结 158
思考题 158
第8章 K-means聚类算法 159
8.1 简介 159
8.2 K-means聚类算法原理 159
8.3 K-means聚类算法实例分析 161
8.4 K-means聚类算法源程序分析 164
8.5 K-means聚类算法的特点及应用 171
8.5.1 K-means聚类算法的特点 171
8.5.2 K-means聚类算法的应用 171
8.6 小结 172
思考题 172
第9章 K-中心点聚类算法 173
9.1 简介 173
9.2 K-中心点聚类算法原理 173
9.3 K-中心点聚类算法实例分析 174
9.4 K-中心点聚类算法源程序分析 175
9.5 K-中心点聚类算法的特点及应用 183
9.5.1 K-中心点聚类算法的特点 183
9.5.2 K-中心点聚类算法的应用 183
9.6 小结 183
第10章 神经网络聚类方法:SOM 184
10.1 简介 184
10.2 竞争学习算法基础 184
10.2.1 自组织神经网络结构 184
10.2.2 自组织神经网络的原理 185
10.3 SOM算法原理 187
10.3.1 SOM网络的拓扑结构 187
10.3.2 SOM权值调整域 188
10.3.3 SOM网络运行原理 189
10.3.4 学习方法 189
10.4 SOM算法实例分析 190
10.4.1 问题描述 190
10.4.2 网络设计及学习结果 191
10.4.3 结果输出 191
10.5 SOM算法源程序分析 192
10.6 SOM算法的特点及应用 202
10.6.1 SOM特点 202
10.6.2 SOM应用 202
10.7 小结 203
思考题 203
第11章 数据挖掘的发展 204
11.1 Web挖掘 204
11.1.1 Web数据挖掘定义 204
11.1.2 Web数据挖掘分类 204
11.1.3 Web数据挖掘的数据源 206
11.1.4 Web数据挖掘中知识的分类 207
11.1.5 Web数据挖掘的关键问题 208
11.2 空间数据挖掘 209
11.2.1 空间数据挖掘的定义与特点 209
11.2.2 空间数据挖掘的体系结构 210
11.2.3 空间数据挖掘可获得的知识类型 210
11.2.4 空间数据挖掘的方法 212
11.3 流数据挖掘 215
11.3.1 流数据的特点 215
11.3.2 流数据挖掘关键技术 215
11.3.3 流数据挖掘的实际应用及前景 217
11.4 数据挖掘与可视化技术 218
11.4.1 什么是可视化 218
11.4.2 数据可视化技术分类 219
11.4.3 数据挖掘可视化技术的应用 221
11.5 小结 222
思考题 223
参考文献 224