《胸有成竹!数据分析的SAS EG进阶》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:人大经济论坛主编;徐筱刚编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2015
  • ISBN:9787121252433
  • 页数:171 页
图书介绍:本书是一部面向数据分析/挖掘初学者的作品。全书以实践和实用为主旨,讲述如何使用计算机软件,将有关数据收集,并加以分类、统计、分析等,从而可以取得有价值的信息。以软件的操作与具体的案例相结合的方法告诉读者,如何将技能与实际操作相结合,使读者掌握数据分析/挖掘的目的、理念、思路与分析步骤。本书共5章,包括数据分析/挖掘方法概述、生成汇总统计量、描述性数据分析/挖掘方法、预测性数据分析/挖掘方法和时间序列,每章都结合了具体的案例,可以供读者进行实际操作。本书对于方法的介绍,尽量避免涉及过多的数学内容,其中和高等数学相关的只在线形回归和主成分分析这两节出现,而且都辅以图形作形象地展现。因此,本书的读者只需要具有一般水平的数学基础即可。本书强调每种方法的假设、适用条件和与数据分析/挖掘主题的匹配,同时有具体案例方便读者动手进行实践。

第1章 数据分析方法概述 1

1.1 数据分析概述 2

1.1.1 数据分析过程 2

1.1.2 数据分析的商业驱动 3

1.2 数据分析与挖掘方法分类介绍 5

1.2.1 描述性——无监督的学习 7

1.2.2 预测性——有监督的学习 10

1.3 数据分析的方法论 12

1.3.1 数据挖掘的项目管理方法论:CRISP-DM 13

1.3.2 数据整理与建模的方法论:SEMMA 14

1.3.3 SAS EG任务菜单编排与SEMMA之间的关系 16

第2章 描述数据特征 18

2.1 认识数据类型 19

2.2 单变量描述统计方法 20

2.2.1 分类变量的描述 21

2.2.2 连续变量的描述 21

2.3 创建频数报表 31

2.4 生成汇总统计量 33

2.5 用汇总表任务生成汇总报表 35

2.6 绘制条形图 37

2.7 绘制地图 41

第3章 描述性数据分析/挖掘方法 45

3.1 客户细分方法介绍 46

3.1.1 客户细分的意义 46

3.1.2 根据客户利润贡献进行划分 47

3.1.3 根据个人或公司的生命历程进行划分 48

3.1.4 根据客户的产品偏好进行划分 49

3.1.5 根据客户交易/消费行为进行划分 50

3.1.6 根据客户的多维行为属性细分 51

3.1.7 展现客户/产品结构的战略细分 51

3.1.8 客户细分:综合运用 52

3.2 连续变量间关系探索与变量约减 52

3.2.1 多元统计基础 52

3.2.2 多元变量压缩的思路 56

3.2.3 主成分分析 58

3.2.4 因子分析 66

3.3 聚类分析 72

3.3.1 基本逻辑 74

3.3.2 系统聚类 74

3.3.3 快速聚类 81

第4章 预测性数据分析方法 87

4.1 构造对连续变量的预测模型 88

4.1.1 方差分析(ANOVA) 88

4.1.2 线性回归 99

4.1.3 线性回归的模型诊断 111

4.2 构造对二分类变量的预测模型 119

4.2.1 分类变量之间的相关性检验 119

4.2.2 逻辑回归 123

4.3 数据挖掘流程及示例 135

第5章 时间序列 143

5.1 认识时间序列和趋势分解法 144

5.2 平稳时间序列(ARMA)模型设定与识别 147

5.2.1 平稳时间序列定义 147

5.2.2 平稳时间序列模型建模 148

5.2.3 ARMA的模型设定与识别 148

5.3 非平稳时间序列(ARIMA)模型 152

5.4 时间序列建模步骤 153

附录A 数据说明 160

附录B CDA(注册数据分析师)致力于最好的数据分析人才建设 167

参考文献 171