第1章 数据挖掘和Modeler使用概述 1
1.1 数据挖掘的产生背景 1
1.2 什么是数据挖掘 8
1.3 Modeler软件概述 23
第2章 Modeler的数据读入和数据集成 40
2.1 变量类型 40
2.2 读入数据 42
2.3 生成实验方案 52
2.4 数据集成 54
第3章 Modeler的数据理解 64
3.1 变量说明 64
3.2 数据质量的评估和调整 70
3.3 数据的排序 79
3.4 数据的分类汇总 83
第4章 Modeler的数据准备 86
4.1 变量变换 86
4.2 变量派生 94
4.3 数据精简 105
4.4 数据筛选 109
4.5 数据准备的其他工作 115
第5章 Modeler的基本分析 125
5.1 数值型变量的基本分析 125
5.2 两分类型变量相关性的研究 136
5.3 两总体的均值比较 146
5.4 RFM分析 155
第6章 Modeler的数据精简 162
6.1 变量值的离散化处理 162
6.2 特征选择 172
6.3 因子分析 179
第7章 分类预测:Modeler的决策树 194
7.1 决策树算法概述 195
7.2 Modeler的C5.0算法及应用 200
7.3 Modeler的分类回归树及应用 225
7.4 Modeler的CHAID算法及应用 245
7.5 Modeler的QUEST算法及应用 250
7.6 模型的对比分析 253
第8章 分类预测:Modeler的人工神经网络 261
8.1 人工神经网络算法概述 262
8.2 Modeler的B-P反向传播网络 268
8.3 Modeler的B-P反向传播网络的应用 282
8.4 Modeler的径向基函数网络及应用 286
第9章 分类预测:Modeler的支持向量机 292
9.1 支持向量分类的基本思路 292
9.2 支持向量分类的基本原理 296
9.3 支持向量回归 303
9.4 支持向量机的应用 307
第10章 分类预测:Modeler的贝叶斯网络 311
10.1 贝叶斯方法基础 311
10.2 贝叶斯网络概述 315
10.3 TAN贝叶斯网络 318
10.4 马尔科夫毯网络 324
10.5 贝叶斯网络的应用 327
第11章 探索内部结构:Modeler的聚类分析 335
11.1 聚类分析的一般问题 335
11.2 Modeler的K-Means聚类及应用 336
11.3 Modeler的两步聚类及应用 345
11.4 Modeler的Kohonen网络聚类及应用 353
11.5 基于聚类分析的离群点探索 364
第12章 探索内部结构:Modeler的关联分析 372
12.1 简单关联规则及其有效性 373
12.2 Modeler的Apriori算法及应用 379
12.3 Modeler的序列关联及应用 387
参考文献 398