《SPSS统计分析与数据挖掘 第2版》PDF下载

  • 购买积分:15 如何计算积分?
  • 作  者:谢龙汉等编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2014
  • ISBN:9787121225499
  • 页数:494 页
图书介绍:本书在第一版基础上,综合读者建议、课题上使用情况进行完善修订。本书基于SPSS 21(2012年12月发布)编写,结合大量实例对SPSS各模块的统计分析功能及图形功能等进行详细讲解。全书内容包括SPSS基础篇、进阶篇及应用篇。重点介绍统计图制作、参数检验、相关分析、判别分析、因子分析、对应分析与结合分析、信度分析、生存分析、时间序列分析、缺失值分析以及SPSS在财务智能、数据预测、股市分析、社会经济分析、金融数据分析等方面的数据挖掘应用。配有所有实例的操作视频及相关源文件。

第1章 SPSS软件概述 1

1.1 SPSS简介 1

1.2 SPSS操作入门 2

1.2.1 软件安装、启动及退出 3

1.2.2 操作环境 4

1.2.3 系统参数的设置 7

1.3 SPSS的帮助系统 14

第2章 SPSS数据挖掘系统 16

2.1 数据挖掘概述 16

2.1.1 数据挖掘的含义 16

2.1.2 数据挖掘与OLAP 17

2.1.3 数据挖掘和统计学 17

2.1.4 数据挖掘的目的 18

2.1.5 数据挖掘应用 18

2.1.6 数据挖掘流程 18

2.2 成功的数据挖掘 19

2.2.1 CRISP-DM方法论 20

2.2.2 选择数据挖掘工具 24

2.2.3 SPSS数据挖掘 25

2.3 SPSS数据挖掘的过程 28

2.3.1 商业理解 28

2.3.2 数据理解 28

2.3.3 数据准备 28

2.3.4 数据模型 29

2.3.5 评估 29

2.3.6 部署 30

第3章 数据文件、变量与函数 32

3.1 SPSS的变量类型 32

3.1.1 数据的输入 33

3.1.2 变量的编辑 34

3.2 数据文件的打开和保存 36

3.2.1 打开SPSS数据文件 36

3.2.2 打开其他格式的数据文件 36

3.2.3 数据文件保存 37

3.3 SPSS函数 38

3.3.1 算术函数 38

3.3.2 统计函数 38

3.3.3 逻辑函数 39

3.3.4 日期和时间函数 39

3.3.5 随机变量函数 41

3.3.6 反分布函数 43

3.3.7 累计分布函数 43

3.3.8 缺失值函数 45

3.3.9 字符串函数 46

第4章 数据预处理 48

4.1 数据文件的整理 48

4.1.1 排序个案(Sort Case)过程 49

4.1.2 转置(Transpose)过程 49

4.1.3 合并文件(Merge File)过程 50

4.1.4 分类汇总(Aggregate)过程 52

4.1.5 拆分文件(Split File)过程 54

4.1.6 选择个案(Select Cases)过程 54

4.1.7 加权个案(Weight Cases)过程 55

4.2 数据变量的变换和计算 55

4.2.1 计算变量(Compute Variables)过程 56

4.2.2 计数(Count)过程 58

4.2.3 重新编码(Recode)过程 59

4.2.4 个案排秩(Rank Cases)过程 60

4.2.5 自动重新编码(Automatic Recode)过程 62

第5章 基本统计分析 64

5.1 基本概念 64

5.1.1 基本的统计概念 64

5.1.2 描述性统计分析 66

5.2 频数分析 67

5.2.1 Frequencies过程的操作界面 67

5.2.2 实例分析 69

5.3 描述性统计分析过程 71

5.3.1 Descriptive过程的参数设置 71

5.3.2 实例分析 71

5.4 数据探索性分析过程 73

5.4.1 Explore过程的参数设置 73

5.4.2 实例分析 74

5.5 列联表分析过程 77

5.5.1 Crosstabs过程的参数设置 77

5.5.2 实例分析 80

第6章 参数检验 83

6.1 参数估计和假设检验概述 83

6.1.1 参数估计 83

6.1.2 假设检验 86

6.2 均值(Means)过程 91

6.2.1 SPSS的均值(Means)过程参数设置 91

6.2.2 均值(Means)过程实例 92

6.3 单样本t检验 93

6.3.1 单样本t检验过程的参数设置 93

6.3.2 实例分析 94

6.4 独立样本t检验 96

6.4.1 独立样本t检验过程的参数设置 96

6.4.2 实例分析 97

6.5 配对两样本t检验 99

6.5.1 配对两样本t检验过程的参数设置 99

6.5.2 实例分析 99

第7章 基本图形的绘制 102

7.1 统计图概述 102

7.2 条形图 103

7.3 线图 107

7.4 面积图 109

7.5 饼图 110

7.5.1 SPSS设置 110

7.5.2 实例分析 111

7.6 高低图 112

7.7 质量控制图 113

7.8 箱图 118

7.8.1 SPSS参数设置 118

7.8.2 实例分析 119

7.9 散点图 120

7.9.1 SPSS参数设置 121

7.9.2 实例分析 121

7.10 直方图 123

7.11 时间序列图 125

7.11.1 SPSS参数设置 125

7.11.2 实例分析 129

第8章 非参数检验 132

8.1 非参数检验概述 132

8.2 x2检验 133

8.2.1 x2检验的参数设置 134

8.2.2 x2检验实例分析 136

8.3 二项分布检验 138

8.3.1 二项分布检验的参数设置 138

8.3.2 实例分析 138

8.4 游程检验 140

8.4.1 游程检验的参数设置 141

8.4.2 实例分析 141

8.5 单样本K-S检验 143

8.5.1 单样本K-S检验的参数设置 143

8.5.2 实例分析 144

8.6 两独立样本分布位置检验 146

8.6.1 两独立样本分布位置检验的参数设置 147

8.6.2 实例分析 147

8.7 多个独立样本分布位置检验 149

8.7.1 SPSS参数设置 149

8.7.2 实例分析 150

8.8 两相关样本分布位置检验 152

8.8.1 SPSS参数设置 152

8.8.2 实例分析 153

8.9 多个配对样本分布位置检验 154

8.9.1 SPSS参数设置 155

8.9.2 实例分析 155

第9章 方差分析 158

9.1 方差分析的基本原理 158

9.1.1 自由度与平方和分解 159

9.1.2 F检验 161

9.1.3 多重比较 162

9.2 单因素方差分析 163

9.2.1 单因素方差分析步骤 164

9.2.2 判断与结论 165

9.2.3 One-Way ANOVA过程的参数设置 165

9.2.4 实例分析 168

9.3 多因素方差分析 169

9.3.1 只考虑主效应的多因素方差分析 169

9.3.2 存在交互效应的多因素方差分析 171

9.3.3 Univariate过程参数设置 173

9.3.4 实例分析 178

9.4 协方差分析 182

9.4.1 协方差分析概述 182

9.4.2 实例分析 183

第10章 回归分析 186

10.1 线性回归 186

10.1.1 线性回归模型 187

10.1.2 最小二乘估计 187

10.1.3 回归方程的显著性检验 188

10.1.4 预测问题 190

10.1.5 SPSS线性回归分析设置 191

10.1.6 回归分析模型的实例分析 195

10.2 非线性回归 198

10.2.1 非线性回归分析的基本原理 199

10.2.2 非线性回归参数设置 199

10.2.3 案例——销售数量和广告投入的非线性回归分析 202

10.3 Logistic回归 205

10.3.1 Logistic回归模型概述 205

10.3.2 Binary Logistic回归模型参数设置 206

10.3.3 案例——银行贷款的信用风险分析 209

第11章 相关分析 214

11.1 相关分析概述 214

11.1.1 相关关系 214

11.1.2 相关图形和相关系数 215

11.1.3 SPSS的相关分析功能简介 217

11.2 Bivariate(双变量)过程 217

11.2.1 双变量相关分析简介 217

11.2.2 Bivariate过程的参数设置 219

11.2.3 案例——汽车销售中各变量之间的相关分析 220

11.3 Partial(偏相关)过程 223

11.3.1 Partial过程的参数设置 223

11.3.2 案例——医疗门诊病人的流动情况分析 224

11.4 Distances(距离)过程 226

11.4.1 Distances过程的参数设置 226

11.4.2 案例——全国各个省市自治区直辖市的农民家庭收支的分布研究 229

第12章 聚类分析 231

12.1 聚类分析的原理 231

12.1.1 一般原理 232

12.1.2 聚类分析步骤 235

12.1.3 系统聚类方法 236

12.2 快速样本聚类过程 239

12.2.1 快速聚类简介 239

12.2.2 SPSS快速聚类的设置 239

12.2.3 案例——2006年中国主要城市空气质量的比较分析 241

12.3 系统聚类过程 245

12.3.1 系统聚类简介 245

12.3.2 SPSS系统聚类设置 245

12.3.3 案例——中国经济地理区域的聚类分析 248

12.4 两阶段聚类分析 251

12.4.1 两阶段聚类简介 251

12.4.2 SPSS两阶段聚类的设置 252

12.4.3 案例——两阶段聚类分析应用于农村居民人均收入与生活消费支出研究 253

第13章 判别分析 256

13.1 判别分析的基本原理 256

13.1.1 判别分析简介 256

13.1.2 判别分析的数学模型与判别方法 257

13.2 一般判别分析 263

13.2.1 一般判别分析的参数设置 263

13.2.2 案例——上市公司类型的比较分析 266

13.3 逐步判别分析 271

13.3.1 逐步判别的参数设置 271

13.3.2 案例——全国部分省市地区的农民家庭收支的分布规律研究 272

第14章 因子分析 278

14.1 因子分析简介 278

14.1.1 因子分析的基本原理 279

14.1.2 因子分析的基本步骤和过程 281

14.2 SPSS因子分析 281

14.2.1 SPSS因子分析的参数设置 281

14.2.2 案例——汽车销售的数据中各变量的因子分析 285

第15章 对应分析 290

15.1 对应分析的基本原理 290

15.2 简单对应分析 292

15.2.1 Correspondence Analysis过程 292

15.2.2 案例——简单对应分析实例 295

15.3 Optimal Scaling过程 298

15.3.1 Optimal Scaling过程的SPSS参数设置 298

15.3.2 案例——最优尺度分析实例 305

第16章 可靠性和多维尺度分析 309

16.1 可靠性分析 309

16.1.1 可靠性分析的基本原理 309

16.1.2 可靠性分析的参数设置 311

16.1.3 案例——电视节目调查数据可靠性分析 313

16.2 多维尺度分析 315

16.2.1 多维尺度分析简介 315

16.2.2 ALSCAL过程的参数设置 316

16.2.3 案例——多维尺度实例分析 319

第17章 生存分析 322

17.1 生存分析简介 322

17.1.1 生存分析的基本概念 322

17.1.2 生存资料的特点 324

17.1.3 生存分析方法 324

17.1.4 SPSS中的生存分析过程 325

17.2 Life Tables过程 326

17.2.1 Life Tables过程的参数设置 326

17.2.2 案例——电信公司客户流失分析 327

17.3 Kaplan-Meier分析 331

17.3.1 Kaplan-Meier分析的步骤 331

17.3.2 案例——新药开发的数据分析 333

17.4 Cox模型回归分析 336

17.4.1 Cox回归模型 336

17.4.2 Cox模型参数设置 338

17.4.3 案例——电信公司的客户流失的Cox回归模型分析 342

第18章 对数线性模型 347

18.1 对数线性模型概述 347

18.2 General过程 348

18.2.1 General过程的参数设置 348

18.2.2 实例分析 351

18.3 Logit过程 353

18.3.1 Logit过程的参数设置 353

18.3.2 实例分析 356

18.4 模型选择(Model Selection)过程 359

18.4.1 模型选择的参数设置 359

18.4.2 实例分析 361

第19章 时间序列分析 364

19.1 时间序列概述 364

19.1.1 时间序列的组成部分 364

19.1.2 时间序列的数学模型 365

19.1.3 时间序列的分析步骤 367

19.1.4 SPSS时间序列分析功能 367

19.2 时间序列数据的预处理 374

19.2.1 缺失值替换 374

19.2.2 定义时间变量 375

19.2.3 时间序列的平稳化 375

19.3 指数平滑模型过程 376

19.3.1 指数平滑的基本原理 376

19.3.2 指数平滑模型的参数设置 379

19.3.3 案例——销售数据预测分析 380

19.4 ARIMA模型 385

19.4.1 ARIMA模型的基本原理 385

19.4.2 ARIMA模型的参数设置 388

19.4.3 案例——上海证券交易所综合指数收益率模拟预测分析 389

19.5 季节分解模型过程 393

19.5.1 季节分解模型的参数设置 393

19.5.2 案例——具有季节因素的服装销售数据的预测分析 394

第20章 缺失值分析 398

20.1 缺失值理论概述 398

20.1.1 数据缺失方式 399

20.1.2 缺失值处理方法 399

20.2 SPSS缺失值分析操作 403

20.2.1 缺失值分析的参数设置 403

20.2.2 案例——数据集中缺失值的实例分析 407

第21章 决策树模型 413

21.1 决策树模型概述 413

21.1.1 CHAID算法 415

21.1.2 Exhaustive CHAID算法 416

21.1.3 CART算法 416

21.1.4 QUEST算法 417

21.2 决策树的参数设置 417

21.2.1 变量设置 417

21.2.2 类别(Categories)设置 418

21.2.3 输出(Output)设置 419

21.2.4 验证(Validation)设置 421

21.2.5 保存(Save)设置 422

21.2.6 条件(Criteria)设置 423

21.2.7 CHAID算法设置 424

21.2.8 CART算法设置 424

21.2.9 QUEST算法设置 425

21.2.10 修剪(Pruning)设置 425

21.2.11 替代变量(Surrogates)设置 426

21.2.12 选项(Options)设置 426

21.2.13 误分类成本设置 427

21.2.14 利润(Profits)设置 427

21.2.15 先验概率(Prior Probabilities)设置 428

21.2.16 实例分析 429

21.2.17 模型建立 429

21.2.18 模型评估 431

第22章 神经网络 438

22.1 神经网络概述 438

22.1.1 历史及现状 439

22.1.2 神经网络特点 440

22.1.3 神经元模型 441

22.1.4 神经网络模型 442

22.1.5 神经网络的学习规则 442

22.1.6 SPSS神经网络模型 443

22.2 SPSS神经网络模型的设置 445

22.2.1 多层感知器(MLP)的设置 445

22.2.2 径向基函数(RBF)的设置 453

22.3 实例分析 455

22.3.1 参数设置 456

22.3.2 结果分析 458

第23章 信用风险分析 463

23.1 信用风险概述 463

23.1.1 信用风险基本概念 463

23.1.2 信用风险度量方法 464

23.1.3 SPSS中信用风险分析模块 467

23.2 案例分析 467

23.2.1 Binary Logistic(二元Logistic)过程 467

23.2.2 Tree(决策树)过程 472

23.2.3 Discriminant(判别)过程 478

第24章 SPSS在社会经济综合评价中的应用 483

24.1 沿海省市经济综合指标的主成分分析 483

24.2 中国内地城镇居民消费结构的聚类分析 487

24.3 我国内地可支配收入和消费性支出之间的回归分析 491