第1章 数据挖掘概述 1
1.1数据挖掘定义 1
1.1.1数据挖掘的技术定义 1
1.1.2数据挖掘的商业定义 2
1.2数据挖掘的重要性及意义 3
1.3数据挖掘功能 6
1.4数据挖掘步骤和标准 10
1.4.1数据挖掘步骤 10
1.4.2数据挖掘需要的人员 11
1.5数据挖掘常用方法 11
1.5.1数据挖掘的对象 11
1.5.2数据挖掘的常用方法 13
练习题 16
第2章 关联规则 17
2.1关联规则介绍 17
2.2关联规则种类 18
2.2.1一般意义上的关联规则 18
2.2.2带有时间性的序列关联分析 19
2.3关联规则算法 21
2.3.1普通的关联规则算法 21
2.3.2序列关联规则算法 24
2.4STATISTICA中的关联规则 27
2.5案例分析 28
练习题 40
第3章 聚类分析 41
3.1聚类分析介绍 41
3.2距离定义 44
3.2.1点之间的距离 44
3.2.2类之间的距离 50
3.3聚类分析算法 51
3.3.1层次聚类 51
3.3.2基于划分的聚类 52
3.3.3EM聚类 55
3.4STATISTICA中的聚类分析 57
3.5案例分析 59
练习题 85
第4章 决策树建模 86
4.1决策树介绍 86
4.1.1决策树的基本知识 87
4.1.2决策树的应用和发展趋势 89
4.2树的建模过程 91
4.2.1数据要求 92
4.2.2树的生长 93
4.2.3有效性和风险性 96
4.2.4属性选择 98
4.3STATISTICA中的决策树 117
4.4案例分析 119
练习题 127
第5章 神经网络建模 129
5.1神经网络介绍 129
5.2神经网络的基本概念和原理 130
5.2.1基本组成单元 130
5.2.2神经网络的训练过程 135
5.2.3基本的神经网络模型 138
5.3STATISTICA中的神经网络模型 152
5.4案例分析 153
练习题 169
第6章 回归分析 170
6.1回归分析介绍 170
6.2线性回归模型 171
6.2.1模型的建立及未知参数的估计 171
6.2.2回归方程与回归参数的检验及变量的选择问题 173
6.2.3回归诊断和决定系数 174
6.3Logistic回归模型 174
6.3.1Logistic回归模型的建立 174
6.3.2Logistic回归模型的参数估计 177
6.3.3Logistic回归模型的检验及诊断 179
6.3.4Logistic回归模型结果的解释 183
6.3.5Logistic回归模型的扩展 184
6.4STATISTICA中的回归 186
6.5案例分析 187
练习题 206
第7章 时间序列 207
7.1时间序列介绍 207
7.2时间序列算法 209
7.2.1传统时间序列分析 209
7.2.2ARIMA模型 212
7.3STATISTICA中的时间序列 218
7.4案例分析 219
练习题 239
参考文献 240