《基于Clementine的数据挖掘》PDF下载

  • 购买积分:15 如何计算积分?
  • 作  者:薛薇等编著
  • 出 版 社:北京:中国人民大学出版社
  • 出版年份:2012
  • ISBN:9787300151625
  • 页数:467 页
图书介绍:数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模式化的处理,从中提取辅助商业决策的关键性数据。本书基于Clementine讲述了数据挖掘的主要原理及应用。

第1章 数据挖掘和Clementine使用概述 1

1.1数据挖掘的产生背景 1

1.2什么是数据挖掘 8

1.3 Clementine软件概述 23

第2章 Clementine的数据读入和数据集成 41

2.1变量类型 41

2.2读入数据 43

2.3生成实验方案 53

2.4数据集成 55

第3章 Clementine的数据理解 65

3.1变量说明 65

3.2数据质量的评估和调整 71

3.3数据的排序 81

3.4数据的分类汇总 85

3.5用户报表 87

第4章 Clementine的数据准备 94

4.1变量变换 94

4.2变量派生 102

4.3数据精简 113

4.4数据筛选 117

4.5数据准备的其他工作 122

第5章 Clementine的基本分析 133

5.1数值型变量的基本分析 133

5.2两分类型变量相关性的研究 145

5.3两总体的均值比较 157

5.4 RFM分析 166

第6章 Clementine的数据精简 173

6.1变量值的离散化处理 173

6.2特征选择 184

6.3因子分析 191

第7章 分类预测:Clementine的决策树 206

7.1决策树算法概述 207

7.2 Clementine的C5.0算法及应用 212

7.3 Clementine的分类回归树及应用 238

7.4 Clementine的CHAID算法及应用 258

7.5 Clementine的QUEST算法及应用 264

7.6模型的对比分析 266

第8章 分类预测:Clementine的人工神经网络 275

8.1人工神经网络算法概述 276

8.2 Clementine的B-P反向传播网络 282

8.3 Clementine的B-P反向传播网络的应用 296

8.4 Clementine的径向基函数网络及应用 301

第9章 分类预测:Clementine的支持向量机 306

9.1支持向量分类的基本思路 306

9.2支持向量分类的基本原理 310

9.3支持向量回归 317

9.4支持向量机的应用 321

第10章 分类预测:Clementine的Logistic回归分析 325

10.1 Logistic回归分析概述 325

10.2二项Logistic回归分析 326

10.3二项Logistic回归分析的应用 335

10.4多项Logistic回归分析及应用 346

第11章 分类预测:Clementine的判别分析 353

11.1距离判别法 354

11.2 Fisher判别法 356

11.3贝叶斯判别法 359

11.4判别分析的应用 360

第12章 分类预测:Clementine的贝叶斯网络 373

12.1贝叶斯方法基础 373

12.2贝叶斯网络概述 377

12.3 TAN贝叶斯网络 380

12.4马尔科夫毯网络 386

12.5贝叶斯网络的应用 389

第13章 探索内部结构:Clementine的聚类分析 397

13.1聚类分析的一般问题 397

13.2 Clementine的K-Means聚类及应用 398

13.3 Clementine的两步聚类及应用 407

13.4 Clementine的Kohonen网络聚类及应用 416

13.5基于聚类分析的离群点探索 427

第14章 探索内部结构:Clementine的关联分析 435

14.1简单关联规则及其有效性 436

14.2 Clementine的Apriori算法及应用 442

14.3 Clementine的GRI算法及应用 450

14.4 Clementine的序列关联及应用 455

参考文献 466