第1章 数据挖掘和Clementine使用概述 1
1.1数据挖掘的产生背景 1
1.2什么是数据挖掘 8
1.3 Clementine软件概述 23
第2章 Clementine的数据读入和数据集成 41
2.1变量类型 41
2.2读入数据 43
2.3生成实验方案 53
2.4数据集成 55
第3章 Clementine的数据理解 65
3.1变量说明 65
3.2数据质量的评估和调整 71
3.3数据的排序 81
3.4数据的分类汇总 85
3.5用户报表 87
第4章 Clementine的数据准备 94
4.1变量变换 94
4.2变量派生 102
4.3数据精简 113
4.4数据筛选 117
4.5数据准备的其他工作 122
第5章 Clementine的基本分析 133
5.1数值型变量的基本分析 133
5.2两分类型变量相关性的研究 145
5.3两总体的均值比较 157
5.4 RFM分析 166
第6章 Clementine的数据精简 173
6.1变量值的离散化处理 173
6.2特征选择 184
6.3因子分析 191
第7章 分类预测:Clementine的决策树 206
7.1决策树算法概述 207
7.2 Clementine的C5.0算法及应用 212
7.3 Clementine的分类回归树及应用 238
7.4 Clementine的CHAID算法及应用 258
7.5 Clementine的QUEST算法及应用 264
7.6模型的对比分析 266
第8章 分类预测:Clementine的人工神经网络 275
8.1人工神经网络算法概述 276
8.2 Clementine的B-P反向传播网络 282
8.3 Clementine的B-P反向传播网络的应用 296
8.4 Clementine的径向基函数网络及应用 301
第9章 分类预测:Clementine的支持向量机 306
9.1支持向量分类的基本思路 306
9.2支持向量分类的基本原理 310
9.3支持向量回归 317
9.4支持向量机的应用 321
第10章 分类预测:Clementine的Logistic回归分析 325
10.1 Logistic回归分析概述 325
10.2二项Logistic回归分析 326
10.3二项Logistic回归分析的应用 335
10.4多项Logistic回归分析及应用 346
第11章 分类预测:Clementine的判别分析 353
11.1距离判别法 354
11.2 Fisher判别法 356
11.3贝叶斯判别法 359
11.4判别分析的应用 360
第12章 分类预测:Clementine的贝叶斯网络 373
12.1贝叶斯方法基础 373
12.2贝叶斯网络概述 377
12.3 TAN贝叶斯网络 380
12.4马尔科夫毯网络 386
12.5贝叶斯网络的应用 389
第13章 探索内部结构:Clementine的聚类分析 397
13.1聚类分析的一般问题 397
13.2 Clementine的K-Means聚类及应用 398
13.3 Clementine的两步聚类及应用 407
13.4 Clementine的Kohonen网络聚类及应用 416
13.5基于聚类分析的离群点探索 427
第14章 探索内部结构:Clementine的关联分析 435
14.1简单关联规则及其有效性 436
14.2 Clementine的Apriori算法及应用 442
14.3 Clementine的GRI算法及应用 450
14.4 Clementine的序列关联及应用 455
参考文献 466