《SPSS统计分析与数据挖掘 第3版》PDF下载

  • 购买积分:15 如何计算积分?
  • 作  者:谢龙汉,蔡思祺编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2017
  • ISBN:9787121329074
  • 页数:495 页
图书介绍:本书基于SPSS 24.0编写,在修正并完善第2版的基础上完成的;每章均有大量分析案例,结合案例对SPSS各模块的统计分析功能和图形功能进行详细讲解。本书具体内容为SPSS简介、SPSS数据挖掘系统介绍、数据文件管理、数据预处理、基本统计分析、多重反应分析、均值的比较与检验、统计图制作、参数检验、回归分析、方差分析、相关分析、聚类分析、判别分析、因子分析、对应分析、信度分析、生存分析、对数线性模型、时间序列分析、缺失值分析,以及SPSS在财务智能、数据预测、股市分析、社会经济分析、金融数据分析等方面的数据挖掘应用。本书最大特点是抛弃了其他同类书籍中只介绍理论用法、缺乏案例分析的弊端,全书给出大量数据挖掘分析案例,并配有视频讲解,为读者展示SPSS在数据分析、信用风险管理、直销分析、社会经济分析等实际项目中的应用。

第1章 SPSS软件概述 1

1.1SPSS简介 1

1.2SPSS操作入门 2

1.2.1软件安装、启动及退出 3

1.2.2操作环境 4

1.2.3系统参数的设置 7

1.3SPSS的帮助系统 15

第2章 SPSS数据挖掘系统 17

2.1数据挖掘概述 17

2.1.1数据挖掘的含义 17

2.1.2数据挖掘与OLAP 18

2.1.3数据挖掘和统计学 18

2.1.4数据挖掘的目的 19

2.1.5数据挖掘应用 19

2.1.6数据挖掘流程 19

2.2成功的数据挖掘 20

2.2.1CRISP-DM方法论 21

2.2.2选择数据挖掘工具 25

2.2.3SPSS数据挖掘 26

2.3SPSS数据挖掘的过程 29

2.3.1商业理解 29

2.3.2数据理解 29

2.3.3数据准备 29

2.3.4数据模型 30

2.3.5评估 30

2.3.6部署 31

第3章 数据文件、变量与函数 33

3.1SPSS的变量类型 33

3.1.1数据的输入 34

3.1.2变量的编辑 35

3.2数据文件的打开和保存 36

3.2.1打开SPSS数据文件 37

3.2.2打开其他格式的数据文件 37

3.2.3数据文件保存 38

3.3SPSS函数 38

3.3.1算术函数 39

3.3.2统计函数 39

3.3.3逻辑函数 40

3.3.4日期和时间函数 40

3.3.5随机变量函数 42

3.3.6反分布函数 43

3.3.7累计分布函数 44

3.3.8缺失值函数 46

3.3.9字符串函数 47

第4章 数据预处理 49

4.1数据文件的整理 49

4.1.1个案排序(Sort Case)过程 50

4.1.2转置(Transpose)过程 50

4.1.3合并文件(Merge File)过程 51

4.1.4汇总(Aggregate)过程 53

4.1.5拆分文件(Split File)过程 55

4.1.6选择个案(Select Cases)过程 55

4.1.7个案加权(Weight Cases)过程 56

4.2数据变量的变换和计算 56

4.2.1计算变量(Compute Variables)过程 57

4.2.2计数(Count)过程 59

4.2.3重新编码(Recode)过程 60

4.2.4个案排秩(Rank Cases)过程 61

4.2.5自动重新编码(Automatic Recode)过程 63

第5章 基本统计分析 65

5.1基本概念 65

5.1.1基本的统计概念 65

5.1.2描述性统计分析 67

5.2频率分析 68

5.2.1频率分析过程的操作界面 68

5.2.2实例分析 70

5.3描述性统计分析过程 72

5.3.1描述性统计分析过程参数设置 72

5.3.2实例分析 72

5.4数据探索性分析过程 74

5.4.1数据探索性分析过程参数设置 74

5.4.2实例分析 75

5.5交叉表分析过程 78

5.5.1交叉表过程的参数设置 78

5.5.2实例分析 81

第6章 参数检验 84

6.1参数估计和假设检验概述 84

6.1.1参数估计 84

6.1.2假设检验 87

6.2平均值(Means)过程 92

6.2.1SPSS的平均值过程参数的设置 92

6.2.2平均值过程实例 93

6.3单样本t检验 94

6.3.1单样本t检验过程的参数设置 94

6.3.2实例分析 95

6.4独立样本t检验 97

6.4.1独立样本t检验过程的参数设置 97

6.4.2实例分析 98

6.5成对样本t检验 100

6.5.1成对样本t检验过程的参数设置 100

6.5.2实例分析 100

第7章 基本图形的绘制 103

7.1统计图概述 103

7.2条形图 104

7.3折线图 108

7.4面积图 110

7.5饼图 111

7.5.1饼图参数设置 111

7.5.2实例分析 112

7.6高低图 113

7.7质量控制图 114

7.8箱图 119

7.8.1箱图参数设置 119

7.8.2实例分析 120

7.9散点图 121

7.9.1散点图参数设置 122

7.9.2实例分析 122

7.10直方图 124

7.11P-P图和Q-Q图 124

7.12时间序列图 126

7.12.1时间序列图参数设置 126

7.12.2实例分析 130

第8章 非参数检验 133

8.1非参数检验概述 133

8.2X2检验 134

8.2.1X2检验的参数设置 135

8.2.2X2检验实例分析 137

8.3二项分布检验 139

8.3.1二项分布检验的参数设置 139

8.3.2实例分析 139

8.4游程检验 141

8.4.1游程检验的参数设置 142

8.4.2实例分析 142

8.5单样本K-S检验 144

8.5.1单样本K-S检验的参数设置 144

8.5.2实例分析 145

8.6两个独立样本分布位置检验 147

8.6.1两个独立样本分布位置检验的参数设置 148

8.6.2实例分析 148

8.7多个独立样本分布位置检验 150

8.7.1多个独立样本分布位置检验的参数设置 150

8.7.2实例分析 151

8.8两个相关样本分布位置检验 153

8.8.1两个相关样本分布位置检验的参数设置 153

8.8.2实例分析 154

8.9多个相关样本分布位置检验 155

8.9.1多个相关样本分布位置检验的参数设置 156

8.9.2实例分析 156

第9章 方差分析 159

9.1方差分析的基本原理 159

9.1.1自由度与平方和分解 160

9.1.2F检验 162

9.1.3多重比较 163

9.2单因素ANOVA检验 164

9.2.1单因素ANOVA检验步骤 165

9.2.2判断与结论 166

9.2.3单因素ANOVA检验过程的参数设置 167

9.2.4实例分析 169

9.3多因素方差分析 170

9.3.1只考虑主效应的多因素方差分析 171

9.3.2存在交互效应的多因素方差分析 173

9.3.3单变量过程参数设置 175

9.3.4实例分析 179

9.4协方差分析 183

9.4.1协方差分析概述 183

9.4.2实例分析 184

第10章 回归分析 187

10.1线性回归 187

10.1.1线性回归模型 188

10.1.2最小二乘估计 188

10.1.3回归方程的显著性检验 189

10.1.4预测问题 191

10.1.5SPSS线性回归分析设置 192

10.1.6回归分析模型的实例分析 196

10.2非线性回归 199

10.2.1非线性回归分析的基本原理 200

10.2.2非线性回归参数设置 200

10.2.3实例分析 203

10.3Logistic回归 205

10.3.1Logistic回归模型概述 206

10.3.2二元Logistic回归模型参数设置 207

10.3.3实例分析 210

第11章 相关分析 215

11.1相关分析概述 215

11.1.1相关关系 215

11.1.2相关图形和相关系数 216

11.1.3SPSS的相关分析功能简介 218

11.2双变量(Bivariate)过程 218

11.2.1双变量相关分析简介 218

11.2.2双变量过程的参数设置 220

11.2.3实例分析 222

11.3偏相关(Partial)过程 224

11.3.1偏相关过程的参数设置 224

11.3.2实例分析 225

11.4Distances(距离)过程 227

11.4.1Distances过程的距离分析参数设置 227

11.4.2实例分析 230

第12章 聚类分析 232

12.1聚类分析的原理 232

12.1.1一般原理 233

12.1.2聚类分析步骤 236

12.1.3系统聚类方法 237

12.2快速样本聚类过程 240

12.2.1快速聚类简介 240

12.2.2SPSS快速聚类的设置 240

12.2.3实例分析 242

12.3系统聚类过程 246

12.3.1系统聚类简介 246

12.3.2SPSS系统聚类设置 246

12.3.3实例分析 249

12.4二阶聚类分析 252

12.4.1二阶聚类简介 252

12.4.2SPSS二阶聚类的设置 253

12.4.3实例分析 254

第13章 判别分析 257

13.1判别分析的基本原理 257

13.1.1判别分析简介 257

13.1.2判别分析的数学模型与判别方法 258

13.2一般判别分析 265

13.2.1一般判别分析的参数设置 265

13.2.2实例分析 267

13.3逐步判别分析 272

13.3.1逐步判别的参数设置 272

13.3.2实例分析 273

第14章 因子分析 279

14.1因子分析简介 279

14.1.1因子分析的基本原理 280

14.1.2因子分析的基本步骤和过程 282

14.2SPSS因子分析 283

14.2.1SPSS因子分析的参数设置 283

14.2.2实例分析 286

第15章 对应分析 291

15.1对应分析的基本原理 291

15.2对应分析 293

15.2.1对应分析过程的参数设置 293

15.2.2实例分析 296

15.3最优标度过程 299

15.3.1最优标度过程的参数设置 299

15.3.2实例分析 306

第16章 可靠性和多维标度分析 310

16.1可靠性分析 310

16.1.1可靠性分析的基本原理 310

16.1.2可靠性分析的参数设置 312

16.1.3实例分析 314

16.2多维标度分析 316

16.2.1多维标度分析简介 316

16.2.2多维标度过程的参数设置 317

16.2.3实例分析 320

第17章 生存分析 323

17.1生存分析简介 323

17.1.1生存分析的基本概念 323

17.1.2生存资料的特点 325

17.1.3生存分析方法 326

17.1.4SPSS中的生存分析过程 326

17.2寿命表(Life Tables)过程 327

17.2.1寿命表分析过程的参数设置 327

17.2.2实例分析 328

17.3Kaplan-Meier分析 332

17.3.1Kaplan-Meier分析过程的参数设置 332

17.3.2实例分析 334

17.4Cox模型回归分析 337

17.4.1Cox回归模型 337

17.4.2Cox模型分析过程的参数设置 339

17.4.3实例分析 343

第18章 对数线性模型 348

18.1对数线性模型概述 348

18.2常规模型(General)过程 349

18.2.1常规模型分析过程的参数设置 349

18.2.2实例分析 351

18.3分对数(Logit)过程 354

18.3.1分对数分析过程的参数设置 354

18.3.2实例分析 357

18.4选择模型(Model Selection)过程 360

18.4.1选择模型分析过程的参数设置 360

18.4.2实例分析 362

第19章 时间序列分析 365

19.1时间序列概述 365

19.1.1时间序列的组成部分 365

19.1.2时间序列的数学模型 366

19.1.3时间序列的分析步骤 368

19.1.4SPSS时间序列分析功能 368

19.2时间序列数据的预处理 375

19.2.1缺失值替换 375

19.2.2定义时间变量 376

19.2.3时间序列预测的平稳化 376

19.3指数平滑模型过程 377

19.3.1指数平滑的基本原理 377

19.3.2指数平滑模型分析过程的参数设置 380

19.3.3实例分析 381

19.4ARIMA模型 386

19.4.1ARIMA模型的基本原理 386

19.4.2ARIMA模型分析过程的参数设置 389

19.4.3实例分析 390

19.5季节性分解模型 394

19.5.1季节性分解模型分析过程的参数设置 394

19.5.2实例分析 395

第20章 缺失值分析 399

20.1缺失值理论概述 399

20.1.1数据缺失方式 400

20.1.2缺失值处理方法 400

20.2SPSS缺失值分析 404

20.2.1缺失值分析过程的参数设置 404

20.2.2实例分析 408

第21章 决策树模型 414

21.1决策树模型概述 414

21.1.1CHAID算法 416

21.1.2Exhaustive CHAID算法 417

21.1.3CRT算法 417

21.1.4QUEST算法 418

21.2决策树的参数设置 418

21.2.1变量设置 418

21.2.2类别(Categories)设置 419

21.2.3输出(Output)设置 420

21.2.4验证(Validation)设置 422

21.2.5保存(Save)设置 423

21.2.6条件(Criteria)设置 424

21.2.7CHAID算法设置 425

21.2.8CRT算法设置 425

21.2.9QUEST算法设置 426

21.2.10修剪(Pruning)设置 426

21.2.11替代变量(Surrogates)设置 427

21.2.12选项(Options)设置 427

21.2.13错误分类成本设置 428

21.2.14利润(Profits)设置 428

21.2.15先验概率(Prior Probabilities)设置 429

21.2.16实例分析 430

21.2.17模型建立 430

21.2.18模型评估 432

第22章 神经网络 439

22.1神经网络概述 439

22.1.1历史及现状 440

22.1.2神经网络特点 441

22.1.3神经元模型 442

22.1.4神经网络模型 443

22.1.5神经网络的学习规则 443

22.1.6SPSS神经网络模型 444

22.2SPSS神经网络模型的设置 447

22.2.1多层感知器(MLP)分析过程的参数设置 447

22.2.2径向基函数(RBF)分析过程的参数设置 454

22.3实例分析 456

22.3.1参数设置 457

22.3.2结果分析 459

第23章 信用风险分析 464

23.1信用风险概述 464

23.1.1信用风险基本概念 464

23.1.2信用风险度量方法 465

23.1.3SPSS中信用风险分析模块 468

23.2实例分析 468

23.2.1二元Logistic分析过程 468

23.2.2决策树分析过程 474

23.2.3判别式分析过程 479

第24章 SPSS在社会经济综合评价中的应用 484

24.1沿海省市经济综合指标的主成分分析 484

24.2中国内地城镇居民消费结构的聚类分析 488

24.3我国内地可支配收入和消费性支出之间的回归分析 492