《数据分析与数据挖掘实验指导书》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:郝文宁,靳大尉,程恺编著
  • 出 版 社:北京:国防工业出版社
  • 出版年份:2016
  • ISBN:9787118107975
  • 页数:172 页
图书介绍:本书是《数据分析与数据挖掘》课程的实验指导书,结合大量实例全面阐述了使用SPSS系列软件进行数据分析与挖掘的原理、方法和步骤。全书分为两个部分,第一部分为数据分析实验,主要介绍如何利用SPSS Statistics软件进行统计分析,具体包括T检验、方差分析、相关分析等十三项实验科目,第二部分为数据挖掘实验,主要介绍如何利用Clementine(SPSS Modeler)软件进行数据挖掘,具体包括关联规则挖掘、决策数据分类、神经网络等五项实验科目。

实验1 IBM SPSS Statistics软件使用基础 1

1.1 实验目的与要求 1

1.2 实验原理 1

1.3 实验内容与步骤 1

1.3.1 安装、启动与退出 1

1.3.2 定义变量 3

1.3.3 数据的输入与保存 6

1.3.4 数据文件的编辑与转换 7

1.4 思考题 12

实验2 描述性统计 13

2.1 实验目的与要求 13

2.2 实验原理 13

2.3 实验内容与步骤 14

2.3.1 中心、离散趋势描述实验 14

2.3.2 频数分布分析实验 18

2.4 思考题 24

实验3 参数检验 26

3.1 实验目的与要求 26

3.2 实验原理 26

3.3 实验内容与步骤 28

3.3.1 单样本t检验 28

3.3.2 两独立样本t检验 29

3.3.3 两配对样本t检验 31

3.3.4 单因素完全随机设计的方差分析SPSS过程 33

3.3.5 单因素重复测量设计的方差分析SPSS过程 37

3.3.6 多因素完全随机设计方差分析的SPSS过程 40

3.4 思考题 45

实验4 非参数检验 46

4.1 实验目的与要求 46

4.2 实验原理 46

4.3 实验内容与步骤 47

4.3.1 单样本二项分布检验的SPSS过程 47

4.3.2 相关样本二项分布检验的SPSS过程 50

4.3.3 独立样本二项分布检验的SPSS过程 53

4.3.4 适合性卡方检验的SPSS过程 55

4.3.5 独立性卡方检验的SPSS过程 59

4.3.6 符号与符号秩次检验的SPSS过程 62

4.3.7 秩和检验(曼-惠特尼U检验)的SPSS过程 63

4.3.8 中位数检验的SPSS过程 65

4.4 思考题 67

实验5 相关分析 69

5.1 实验目的与要求 69

5.2 实验原理 69

5.3 实验内容与步骤 70

5.3.1 二元变量相关分析的SPSS过程 70

5.3.2 肯德尔和谐系数计算的SPSS过程 72

5.3.3 偏相关分析的SPSS过程 75

5.4 思考题 79

实验6 回归分析 80

6.1 实验目的与要求 80

6.2 实验原理 80

6.3 实验内容与步骤 81

6.3.1 一元线性回归分析的SPSS过程 81

6.3.2 多元线性回归分析的SPSS过程 84

6.4 思考题 89

实验7 因子分析 91

7.1 实验目的与要求 91

7.2 实验原理 91

7.3 实验内容与步骤 92

7.3.1 因子分析的SPSS过程 92

7.3.2 因素分析结果的读取与解释 97

7.4 思考题 102

实验8 IBM SPSS Modeler软件使用基础 103

8.1 实验目的与要求 103

8.2 实验原理 103

8.2.1 IBM SPSS Modeler简介 103

8.2.2 数据挖掘的CRISP-DM模型 103

8.2.3 Modeler软件使用的技巧 105

8.3 实验内容与步骤 107

8.3.1 Modeler的启动和界面布局 107

8.3.2 完整建模流程的介绍 110

8.4 思考题 114

实验9 关联规则挖掘实验 115

9.1 实验目的与要求 115

9.2 实验原理 115

9.2.1 关联规则处理数据的两种形式 115

9.2.2 关联规则相关概念 116

9.3 实验内容与步骤 117

9.3.1 Apriori算法应用 117

9.3.2 序列关联应用 123

9.4 思考题 127

实验10 决策树分类实验 128

10.1 实验目的与要求 128

10.2 实验原理 128

10.2.1 决策树分类原理 128

10.2.2 决策树分类常用算法 128

10.3 实验内容与步骤 129

10.3.1 导入数据 129

10.3.2 数据认识与处理 130

10.3.3 建立模型与评估 134

10.4 思考题 136

实验11 支持向量机SVM分类实验 137

11.1 实验目的与要求 137

11.2 实验原理 137

11.3 实验内容与步骤 138

11.3.1 导入数据 138

11.3.2 建立模型 139

11.4 思考题 143

实验12 人工神经网络分类实验 144

12.1 实验目的与要求 144

12.2 实验原理 144

12.3 实验内容与步骤 145

12.3.1 导入数据 145

12.3.2 模型建立 145

12.4 思考题 151

实验13 贝叶斯方法分类实验 152

13.1 实验目的与要求 152

13.2 实验原理 152

12.2.1 贝叶斯定理和朴素贝叶斯 152

13.2.2 Modeler中的贝叶斯分类器 153

13.3 实验内容与步骤 154

13.3.1 数据导入 154

13.3.2 贝叶斯网络建模 155

13.4 思考题 159

实验14 K均值与二分法聚类实验 160

14.1 实验目的与要求 160

14.2 实验原理 160

14.2.1 聚类分析 160

14.2.2 K-Means聚类 161

14.2.3 两步聚类 162

14.3 实验内容与步骤 162

14.3.1 K均值聚类 162

14.3.2 两步法类 167

14.4 思考题 171

参考文献 172