第一章 SPSS for Windows快速入门知识 1
第一节 用Windows环境下的SPSS做统计分析的三大步骤 1
一、编辑SPSS的程序 1
二、在Syntax窗口Paste(贴回)命令 4
三、从Windows分菜单快速进入Syntax窗口 5
四、从Windows分菜单快速显示Newdata窗口中的数据 6
第二节 点Windows菜单以显示和打印结果 6
第三节 点Windows菜单项以快速处理Newdata窗口中的数据 8
一、移动、拷贝Newdata窗口中的单元数据 9
二、删除变量和个案 9
三、插入新个案和拷贝新个案 10
第四节 运行一个SPSS过程 11
第五节 打开一个*.SAV目标数据文件 14
第六节 如何读取一个电子表格数据 16
一、SPSS数据文件的特点与规则 16
二、读取电子表格数据的规则 16
三、读取Excel电子表格数据 17
第七节 SPSS如何读取dBASE数据和Foxbase数据 18
一、建立数据库 18
二、读取Foxbase数据库数据,进入SPSS系统 19
第八节 SPSS如何保存数据文件 20
一、将*.SAV文件类型保存成数据库类型*.DBF 20
二、将Newdata窗口中的*.SAV类型转换为ASCII码类型*.DAT 22
习题一 23
一、在Windows下的SPSS中为何不宜重新输入原始数据 25
第二章 在SPSS for Windows中调用DOS版SPSS/PC+的程序文件 25
第一节 Windows下的SPSS如何调用DOS版SPSS/PC+中的程序*.INC 25
二、SPSS直接调用DOS版的SPSS/PC+中的程序*.INC 28
三、用SPSS的New命令调用SPSS/PC+(V4.0以前)程序的步骤 30
第二节 用SPSS的Open命令调用SPSS/PC+(V4.0以前)的程序 31
一、简单步骤介绍 31
二、具体操作步骤 31
习题二 32
第三章 分层对数线性分析模型(Hierarchical Loglinear Models)的应用 35
第一节 对数线性分析的应用 35
第二节 对数线性关系的模型 35
一、饱和模型(Saturated Model) 36
二、饱和模型的观察值与期望值 37
第三节 参数估计 38
第四节 独立模型——非饱和模型 39
一、卡方拟合度的检验 40
二、残差 41
第五节 分层模型 42
第六节 选择模型 43
第七节 卡方统计量的分解 43
一、K次项(及其以上)效应项为零的假设检验 43
二、K次项效应为零的检验 46
第八节 检验模型中个别效应 46
第十节 利用自后淘汰法建立模型 48
第九节 产生各次项效应的程序 48
第十一节 在Windwos中通过对话框进行Loglinear分析 50
一、进入Hiloglinear主对话框的方法 50
二、模型选择(Model) 51
三、Option选项 52
四、对话框的扩充 53
第十二节 在Windows对话框中运行Hiloglinear过程实例 53
一、进入Hiloglinear主对话框 53
二、将对话框中已点选的命令、子命令项粘贴回来,供修改或保存 55
习题三 56
第一节 从逃课现象研究入手 59
第四章 DISCRIMINANT过程的应用 59
一、选择分析的个案 60
二、组间均值差别 60
三、Wilks的λ(Lambda)值 62
四、相关系数的评价 62
五、判别系数的估计 63
六、判别分的计算 64
七、Bayes的分组规则 65
八、分组输出 66
九、个案分组后的概括统计表 66
十、判别分的直方图 68
十一、计算错误分组的比例 68
十三、判别分析的其它统计量 70
十二、不正确分组的期望比例 70
十四、判别函数系数的解释 72
十五、判别函数与变量二者的相关 72
十六、费歇尔分组函数系数 73
十七、与多元回归分析的关系 74
第二节 选择变量的方法 74
一、逐步选择变量的例子 74
二、变量选择的其它标准 78
第三节 三组判别分析 80
一、函数数目 80
二、判别函数的分组 81
三、附加的统计量 83
四、检验判别函数的显著性水平 84
五、变量对判别函数的贡献 86
第四节 当违背假设时 86
第五节 用Windows下的SPSS作判别分析 87
一、首先从Spsswin主菜单中选择Diacriminant过程命令 88
二、定义因变量的判别范围 89
三、选择—子集数据进行判别分析 90
四、判别分析中的统计量选择 90
五、判别分析的逐步选择变量法 91
六、分类(组)判别 93
七、保存判别分析中的新变量 94
八、附加命令语句提高判别特征 94
二、下面子命令只用于Windows版的SPSS中 95
一、DISCRIMINANT命令表 95
第六节 用编程法做判别分析 95
三、“/OPPION=/STATISTICS=”仅用于V4.0前的版本 96
习题四 97
第五章 因素分析 99
第一节 因素分析的模型 99
第二节 因素分析的步骤 100
第三节 因素分析所用的数据和程序 101
一、因素分析的变量 101
二、因素分析的命令文件(程序) 102
第四节 抽取因素(Factor Extraction) 103
第五节 抽取前5个因素 104
第六节 变量的共通性与惟一性 105
第七节 用残差评估相关矩阵和因素模型 107
第八节 用最大似然性法则抽取因素 107
第九节 抽取因素经验小结 110
第十节 转轴前后的对比 111
一、转轴之前的因素矩阵及图形 111
二、转轴后的因素矩阵与因素装载量图 112
三、转轴前后的对比 112
第十一节 转轴的方式 113
一、转轴的方式 113
二、转轴前的情形与经过各种转轴后的结果 114
二、斜交转轴后的因素图形阵和结构阵 115
一、斜交转轴的原理 115
第十二节 斜交转轴 115
第十三节 直角转轴前后的结果比较 117
一、直角转轴前后的因素装载量比较 117
二、直角转轴前后的图形对比 118
第十四节 对转轴效果的验证 119
第十五节 因素分析 119
一、因素解释 119
二、因素模型 120
第十六节 因素分数 120
第十七节 在Windows下的SPSS中作因素分析 122
一、进入Factor主对话框(主命令)的步骤 122
二、Factor分析的Option框 123
三、因素分析时的描述性统计量 124
四、抽取因素个数 124
五、因素装载量的转轴(Rotation) 125
六、因素得分 126
第十八节 在Syntax窗口编辑程序做Factor分析 127
习题五 128
第六章 聚类分析的应用 131
第一节 聚类分析与判别分析的区别 131
第二节 聚类的对象 131
第三节 个案聚类 131
一、个案聚类前的变量选择 131
一、凝聚法(也称连接阶层聚类) 132
第四节 聚类的形成法 132
二、个案聚类前的变量标准化 132
二、凝聚法的标准 133
第五节 聚类分析的全过程 133
一、原始变量及其标准化值 133
二、欧几里德距离平方矩阵 134
三、从冰柱图看聚类情形 135
四、平均连接法的图表 136
五、从树形图分析聚类成员 137
第六节 图形显示的改正 138
第七节 对变量的聚类 139
一、Cluster命令表 140
第八节 采用编程法做聚类分析 140
二、子命令注解 141
第九节 利用Windows下的SPSS做分层聚类分析 147
一、进入Hieraechical(下文简称“分层”聚类分析)子菜单 147
二、选择统计量 148
三、画出聚类分析图 149
四、分层聚类法的选择 149
五、保存分层聚类时的聚类解新变量 153
六、增加命令语句和丰富聚类特征 153
习题六 153
第七章 大文件的聚类分析 155
第一节 聚类方法 155
一、聚心已知后的聚类 155
二、聚心未知时的聚类 159
一、进入K-Means聚类分析子菜单 162
第二节 采用Windows版本的SPSS做大文件聚类分析 162
二、决定聚类中心(聚心) 163
三、K-Means聚类分析的迭代 164
四、K-Means聚类分析中新变量的保存 165
五、K-Means聚类中的统计量选择 165
六、本章例子详解 166
第三节 用编程法进行大文件的聚类 169
一、QUICK Cluster的命令表 169
三、工作原理 170
四、大样本个案的聚类法 170
二、QUICK Cluster过程命令的条件限制 170
五、CRITERIA子命令的用法 171
六、METHOD子命令的用法 171
七、INITIAL子命令的用法 172
八、FILE子命令的用法 172
九、PRINT子命令的用法 172
十、MISSING子命令的用法 173
十一、OUTFILE子命令的用法 173
十二、SAVE子命令的用法 173
习题七 174
第八章 利用Explore过程探测数据 177
第一节 Explore过程可探测数据的哪些错误 177
第二节 做Explore探测的数据文件 178
第三节 数据探测之一:用直方图 179
第四节 图形显示之二:茎一叶图(Stem-Leaf) 180
第五节 框图(Box plot) 182
第六节 统计分析前对假设的检验 184
一、Levene检验 184
二、用幅度—数值图示法检验(Spread-Level) 185
三、转换的形式 185
第七节 正态性检验 186
第八节 集中趋势分布的三种较佳平稳测度 188
一、较佳测度之一:中位数 188
二、较佳测度之二:修正均值 188
三、较佳测度之三:M估计 189
一、进入Explore对话框的步骤 190
第九节 在Windows中进行Explore的数据探测 190
二、Statistics对话框 191
三、利用图形探查 192
四、缺省值处理 193
第十节 在Syntax窗口编程 194
一、EXAMINE命令语句的格式 194
二、EXAMINE过程命令的主要功能 195
三、EXAMINE的命令顺序及基本语句 195
四、VARIABLES子命令 195
五、COMPARE子命令 196
习题八 196
第一节 什么是多元线性回归分析 199
第九章 多元线性回归分析 199
第二节 选择一条回归线 200
第三节 异常点(Outliers) 201
第四节 标准化的回归系数 201
第五节 从样本到总体 201
一、总体参数的估计 202
二、假设的检验 203
三、置信区间 203
第六节 模型的拟合优度 204
一、R2系数 204
二、方差分析 204
第七节 预测值及其标准误差 206
三、R2的另一解释 206
一、预测均值的特性曲线 207
二、预测一个新值时误差的来源 208
三、读个案的预测值和标准误差图 210
第八节 寻找是否满足假设 211
一、残差 211
二、直线性(Linearity) 211
三、等方差性 212
四、误差的独立性 213
五、残差的正态性 214
第九节 设置异常值(Outliers) 216
一、有多个预测变量时的异常值测量法:Mahalanobis距离法 217
二、探测影响点(删除残差与Cook距离法) 218
二、如何变非线性为线性关系 221
第十节 数据不符合线性回归的基本假设时的处理法 221
一、变非线性为线性关系 221
三、偏态分布的改善 222
四、方差的稳定 222
五、数据的对数转换 222
六、假设的重要性 223
第十一节 多元线性回归模型 223
一、起始成绩的预测 224
二、相关系数阵 224
三、偏回归系数 225
第十二节 确定重要的变量 226
一、B系数与Beta系数的不足之处 226
二、部分相关与偏相关 227
一、增删变量时的不同后果 228
二、若有隐含相关,则应控制相应的变量 228
第十三节 回归模型的讨论 228
二、自变量(预测变量)的最佳个数 229
第十四节 向前选择变量法 230
一、向前选择变量的两种标准 230
二、工作原理 231
三、结果分析 231
第十五节 自后淘汰变量(消元)法 232
一、消元法的两种标准值 232
二、消元法的工作原理 232
三、结果分析 233
三、注意事项 234
四、结果分析 234
第十六节 逐步回归 234
二、工作原理 234
一、两种标准值 234
第十七节 多元回归中假设之检验 235
三、比较两幅可比性偏回归图 236
二、用已生成的Res_1和Res_2偏残差变量画出散点图 236
一、用Regreesion产生偏回归图 236
四、用变量的平方法修正线性度 237
第十八节 多元回归中影响点的探测 238
一、找出杠杆值 239
二、逐一排除异常个案法 239
三、探测之三:是否影响回归系数的方差 239
第十九节 共线性诊断 240
一、共线性诊断之一:容许度 240
二、共线性诊断之二:方差膨胀因子VIF 240
四、保存协方差比的方法 240
三、容许度的计算 242
四、共线性诊断之三:特征值和条件指标 242
五、共线性诊断之四:方差比例 242
第二十节 解释回归模型 243
第二十一节 在SPSS for Windows中运行线性回归 244
一、主对话框简析 244
二、WLS选项 246
三、线性回归统计量的选择 246
四、线性回归图 247
五、保存回归的临时变量 248
六、线性回归可选项 249
七、用编程法弥补对话框的功能 250
第二十二节 线性回归的命令、子命令 251
一、VARIABLE子命令 252
二、DEPENDENT子命令 253
三、METHOD子命令 253
四、STATISTICS子命令 254
五、CRITERIA子命令 255
七、DESCRIPTIVES子命令 256
六、ORIGIN子命令和NOORIGIN子命令 256
九、缺省值(MISSING子命令) 257
十、分析残差(使用19个临时变量之一) 257
八、SELECT子命令 257
十一、画出残差图(RESIDUALS子命令) 258
十二、临时变量的Casewise图(用Casewise子命令) 259
第二十三节 应用实例 260
一、程序文件(919293.SPS) 260
二、用REGRESSION窗口的Paste命令剪贴的回归命令 261
习题九 262
一、多选项二分法(Multiple dichotomy method) 265
第十章 多项选择的统计分析过程的应用 265
第一节 什么是多项选择 265
第三节 首先均需选定多项选择的变量集 266
二、多选项分类法(Multiple category method) 266
第二节 多项选择的数据分析法 266
第四节 统计多项选择时的频次 268
第五节 多项选择时的交叉汇总表 270
一、操作步骤 270
二、图形解释 273
第六节 在Syntax窗口输入命令(编程法) 275
一、MULT RESPONSE命令语句一览表 275
四、条件限制及命令的次序 276
三、基本语句 276
二、过程概述 276
六、VARIABLES子命令 277
五、GROUPS子命令 277
七、FREQUENCIES子命令 278
八、TABLES子命令 278
九、TABLES中的PAIRED关键词 279
十、CELLS子命令 280
十一、BASE子命令 280
十二、FORMAT子命令 281
十三、MISSING子命令 281
习题十 282
一、偏相关系数的“阶” 285
第十一章 偏相关分析(PARTIAL过程的应用) 285
第一节 计算偏相关系数 285
二、显著性检验的公式 286
第二节 辨别变量虚假相关 286
一、选择一个控制的变量 287
二、选择两个控制的变量 287
第三节 如何确定被控制的变量 288
一、首先要把握因果关系 288
一、操作步骤 289
二、偏相关主对话框 289
第四节 利用Windows下的Partial做偏相关分析 289
三、产生图11-3的程序命令 289
三、基本选择 290
四、显著性检验的选择(见Test of significance) 290
五、偏相关选择项 290
第五节 在Syntax窗口可附加的功能命令 291
第六节 在Syntax窗口编程的命令语句 291
一、PARTIAL CORR命令语句一览表 291
二、基本语句和条件限制 292
三、VARIABLE子命令 292
四、STATISTICS子命令 293
五、SIGNIFICANCE子命令 293
六、FORMAT子命令 293
八、MATRIX子命令 294
七、MISSING子命令 294
习题十一 297
第十二章 运用PROXIMITY过程做距离测量 299
第一节 区间以上的数据采用距离测量 299
第二节 频率数据采用非相似测量 300
第三节 双择数据采用相似性测量 300
第四节 PROXIMITIES过程命令表 302
一、命令的作用 303
二、命令的最基本写法 303
三、变量指定 303
四、用STANDARDIZE标准化数据 303
六、连续数据的测量法 304
五、MEASURE子命令的用途 304
七、频次数据的测量法 305
八、对分数据(Binary data)的测量法 305
九、例子 307
第五节 MATRIX子命令的功能 307
一、用OUT关键词写一个矩阵数据文件 308
二、矩阵数据文件的内容 308
三、用IN关键词读取已有的矩阵文件 308
四、文件裂变 309
第六节 写/读矩阵的例子 309
一、写矩阵的例子 309
二、读取矩阵文件中的数据 310
三、现存现读矩阵数据文件 310
习题十二 311