第一部分 数据管理与软件入门 3
第1章SPSS入门 3
1.1 SPSS概述 3
1.1.1 SPSS发展简史与版本选择 3
1.1.2 SPSS的产品定位 5
1.1.3 SPSS的基本特点 6
1.1.4 SPSS的客户机/服务器结构与模块化结构 6
1.2 SPSS操作入门 7
1.2.1 SPSS的安装与激活 7
1.2.2 SPSS的启动与退出 8
1.2.3 SPSS的操作方式 9
1.2.4 SPSS对话框操作基本规范 9
1.3 SPSS的窗口、菜单和结果输出 11
1.3.1 SPSS的4种窗口 11
1.3.2 SPSS的菜单 12
1.3.3 SPSS的4种结果输出 14
1.3.4分析结果的保存和导出 16
1.4 SPSS的系统选项、中文化设置与附加安装包 17
1.4.1 SPSS的系统选项与中文化设置 17
1.4.2 SPSS网站提供的附加安装包 18
1.5 SPSS的帮助系统 19
1.5.1学习向导 19
1.5.2帮助菜单 21
1.5.3针对高级用户的帮助功能 22
1.6数据分析方法论概述 22
1.6.1严格设计支持下的统计方法论 23
1.6.2半试验研究支持下的统计方法论 23
1.6.3偏智能化、自动化分析的数据挖掘应用方法论 24
思考与练习 25
第2章 数据录入与数据获取 26
2.1 CCSS案例项目背景 26
2.1.1项目背景 26
2.1.2项目问卷 27
2.2数据格式概述 28
2.2.1统计软件中数据的录入格式 28
2.2.2变量属性 29
2.3数据的直接录入 33
2.3.1操作界面说明 33
2.3.2开放题和简单单选题的录入 34
2.3.3多选题的录入 37
2.4外部数据的获取 39
2.4.1读取电子表格数据文件 39
2.4.2读取文本数据文件 41
2.4.3用ODBC接口读取各种数据库文件 43
2.5数据的保存 44
2.6数据编辑窗口常用操作技巧集锦 45
思考与练习 48
第3章变量级别的数据管理 49
3.1变量赋值 50
3.1.1常用基本概念 50
3.1.2“计算变量”过程对话框 51
3.1.3案例:年龄变量S3的分组 51
3.2已有变量值的分组合并 52
3.2.1对连续性变量进行分组合并 52
3.2.2分类变量类别的合并 53
3.3连续性变量的离散化 54
3.3.1可视离散化过程 54
3.3.2最优离散化过程 55
3.4变量的自动重编码与数值移动 57
3.4.1变量的自动重编码 57
3.4.2变量值的移动 58
3.5转换菜单中的其他功能 59
3.5.1指定数值的查找与计数 59
3.5.2变量的编秩 59
3.5.3自动准备建模数据 60
3.5.4随机数字生成器 61
思考与练习 62
第4章 文件级别的数据管理 63
4.1几个常用过程 63
4.1.1排序个案 63
4.1.2分割文件 65
4.1.3选择个案 65
4.1.4加权个案 67
4.1.5分类汇总 68
4.2数据文件的重组与转置 70
4.2.1数据的长型与宽型格式 70
4.2.2长型格式转换为宽型格式 71
4.2.3宽型格式转换为长型格式 73
4.2.4数据转置 74
4.3多个数据文件的合并 75
4.3.1一些基本概念 75
4.3.2数据文件的纵向拼接 75
4.3.3数据文件的横向合并 76
4.4与数据字典有关的功能 78
4.4.1数据字典的基本概念 78
4.4.2定义变量属性 79
4.4.3复制数据属性 80
4.4.4新建自定义属性和设置未知测量属性 81
4.5与数据准备有关的功能 82
4.5.1 SPSS中与数据准备相关的功能 82
4.5.2数据验证模块 83
4.5.3标识重复个案 85
4.5.4标识异常个案 87
思考与练习 89
第5章SPSS编程与扩展 90
5.1 SPSS编程入门 90
5.1.1基本语法规则 90
5.1.2 SPSS程序的创建方式 92
5.1.3结构化语句简介 93
5.1.4一个简单程序示例 95
5.2语法编辑窗口操作入门 96
5.2.1语法编辑窗口界面 96
5.2.2程序的运行与调试 97
5.3 INCLUDE命令与宏程序 98
5.3.1 INCLUDE命令 98
5.3.2宏程序 99
5.4 OMS系统与程序自动化 100
5.4.1 OMS系统 100
5.4.2程序自动化 103
思考与练习 104
第6章 统计实战案例集锦(一) 105
6.1数据异常值的自动核查与报告 105
6.1.1项目背景 105
6.1.2分析思路 106
6.1.3利用数据验证模块实现查错 106
6.1.4利用函数功能实现查错 108
6.1.5项目总结与讨论 110
6.2 CCSS项目数据的自动计算与处理 110
6.2.1项目背景 110
6.2.2分析思路 111
6.2.3具体操作 112
6.2.4项目总结与讨论 114
思考与练习 114
第二部分 统计描述与统计图表 117
第7章 连续变量的统计描述与参数估计 117
7.1连续变量的统计描述指标体系 117
7.1.1集中趋势的描述指标 118
7.1.2离散趋势的描述指标 119
7.1.3分布特征、其他趋势的描述指标 120
7.1.4 SPSS中的相应功能 121
7.2连续变量的参数估计指标体系 122
7.2.1正态分布 122
7.2.2参数的点估计 123
7.2.3参数的区间估计 124
7.2.4 SPSS中的相应功能 125
7.3案例:信心指数的统计描述 125
7.3.1使用频率过程进行分析 125
7.3.2使用描述过程进行分析 127
7.3.3使用探索过程进行分析 128
7.4 Bootstrap方法 131
7.4.1模型 131
7.4.2案例:对总指数进行Bootstrap估计 132
思考与练习 134
第8章 分类变量的统计描述与参数估计 135
8.1指标体系概述 135
8.1.1单个分类变量的统计描述 135
8.1.2多个分类变量的联合描述 136
8.1.3多选题的统计描述 136
8.1.4分类变量的参数估计 137
8.1.5 SPSS中的相应功能 137
8.2案例:对学历等背景变量进行描述 138
8.2.1使用频率过程进行描述 138
8.2.2使用交叉表过程进行描述 138
8.3案例:对多选题C0还贷状况进行描述 140
8.3.1多选题的频数列表 140
8.3.2多选题的列联表分析 141
思考与练习 143
第9章 数据的报表呈现 144
9.1统计表入门 144
9.1.1统计表的基本框架 144
9.1.2表头、数据区与汇总项 145
9.1.3单元格的数据类型 146
9.1.4几种基本表格类型 146
9.1.5 SPSS中的报表功能 148
9.1.6 SPSS中统计表的基本绘制步骤 149
9.2简单案例:题目A3的标准统计报表制作 149
9.2.1案例简介 149
9.2.2绘制表格基本框架 150
9.2.3设置摘要统计量及格式 152
9.2.4调整各种显示细节 153
9.3复杂案例:题目A3a的标准统计报表制作 154
9.3.1案例简介 154
9.3.2多选题、表格基本框架及汇总项的设定 155
9.3.3设定分类变量小结和汇总项 155
9.3.4对话框的其他选项卡 157
9.4表格的编辑 158
9.4.1基本编辑操作 159
9.4.2主要编辑菜单功能 160
9.4.3表格属性的详细设置 161
9.5表格模板技术 163
9.5.1模板技术简介 163
9.5.2表格的中文兼容问题的解决 165
思考与练习 165
第10章 数据的图形展示 166
10.1统计图概述 166
10.1.1统计图的基本框架 166
10.1.2统计图的种类 168
10.1.3 SPSS的统计绘图功能 171
10.2直方图与茎叶图 171
10.2.1案例:绘制消费者信心值的直方图 172
10.2.2图形的基本编辑操作 174
10.2.3直方图图形框架的修改 178
10.2.4直方图的衍生图形 180
10.2.5茎叶图 182
10.3箱图 183
10.3.1案例:用箱图分月份考察消费者信心的分布 183
10.3.2箱图的编辑 184
10.4饼图 186
10.4.1案例:分城市、月份考察样本性别比例 186
10.4.2饼图的编辑 187
10.5条图与误差图 188
10.5.1简单条图案例:比较不同职业人群的消费者信心值 189
10.5.2复式条图案例:分职业进一步比较不同人群的现状和预期指数 190
10.5.3分段条图与百分条图案例:比较不同月份的A3a选项比例分布 192
10.5.4条图的编辑 194
10.5.5带误差线的条图与误差图 194
10.6线图、面积图、点图与垂线图 197
10.6.1多重线图案例:分城市比较信心指数随时间的变化趋势 197
10.6.2线图的编辑 198
10.6.3面积图、点图与垂线图 199
10.7散点图 200
10.7.1简单散点图案例:年龄S3与消费者信心指数间的关系 200
10.7.2散点图的编辑 201
10.7.3分组散点图案例:分性别考察年龄对信心指数值的影响 203
10.7.4散点图矩阵案例:年龄S3与现状指数、预期指数的关系 204
10.7.5三维散点图 205
10.8 P-P图和Q-Q图 206
10.8.1 P-P图 206
10.8.2 Q-Q图 208
10.9控制图与Pareto图 208
10.9.1控制图 208
10.9.2 Pareto图 211
10.10其他统计图 212
10.10.1高低图 212
10.10.2 ROC曲线 213
10.10.3时间序列分析中使用的图形 215
思考与练习 216
第11章 统计实战案例集锦(二) 217
11.1探索消费者信心指数随背景资料的变化规律 217
11.1.1项目背景 217
11.1.2分析思路 217
11.1.3具体操作 218
11.1.4项目总结与讨论 224
11.2 CCSS项目分析报告的自动化生产 225
11.2.1项目背景 225
11.2.2分析思路 225
11.2.3具体操作 227
11.2.4项目总结与讨论 230
思考与练习 230
第三部分 常用假设检验方法 233
第12章 分布类型的检验 233
12.1假设检验的基本思想 233
12.1.1问题的提出 233
12.1.2假设检验的标准步骤 234
12.1.3假设检验的两类错误 235
12.1.4假设检验中的其他问题 235
12.2正态分布检验 236
12.2.1 K-S检验的原理 236
12.2.2案例:考察信心指数分布是否服从正态分布 236
12.2.3使用旧对话框分析案例 240
12.3二项分布检验 241
12.3.1二项分布检验的原理 241
12.3.2案例:考察抽样数据的性别分布是否平衡 241
12.3.3使用旧对话框分析案例 242
12.4游程检验 243
12.4.1游程检验的原理 243
12.4.2案例:考察CCSS抽样数据是否随机 244
12.4.3使用旧对话框分析案例 245
12.5蒙特卡罗方法 247
12.5.1蒙特卡罗方法简介 247
12.5.2蒙特卡罗方法的SPSS实现 247
12.6本章小结 249
思考与练习 250
第13章 连续变量的统计推断(一)——t检验 251
13.1 t检验概述 251
13.1.1 t检验的基本原理 251
13.1.2 SPSS中的相应功能 253
13.2样本均数与总体均数的比较 253
13.2.1单样本案例:基期一线城市信心指数与基准值的比较 253
13.2.2单样本t检验中的其他问题 255
13.3成组设计两样本均数的比较 256
13.3.1方法原理 256
13.3.2案例:不同收入水平家庭的信心指数比较 257
13.3.3适用条件与方差齐性检验 259
13.4配对设计样本均数的比较 260
13.4.1方法原理 261
13.4.2案例:治疗前后舒张压均数的比较 261
13.5本章小结 263
思考与练习 263
第14章 连续变量的统计推断(二)——单因素方差分析 265
14.1方差分析简介 265
14.1.1进行方差分析的原因 265
14.1.2方差分析的基本思想 265
14.1.3单因素方差分析的应用条件 267
14.2案例:不同时点消费者信心指数的比较 269
14.3均数间的多重比较 272
14.3.1直接校正检验水准 272
14.3.2专用的两两比较方法 273
14.3.3两两比较方法的选择策略 274
14.3.4多重比较结果出现矛盾时的解释 275
14.3.5案例:不同时点信心指数的两两比较 275
14.4各组均数的精细比较 277
14.4.1方法原理 277
14.4.2案例:事先计划的两时点均数比较 278
14.5组间均数的趋势检验 279
14.5.1方法原理 279
14.5.2案例:前3个时点的信心指数线性趋势检验 280
14.6本章小结 281
思考与练习 281
第15章 有序分类变量的统计推断——非参数检验 283
15.1非参数检验概述 283
15.1.1非参数检验的意义 283
15.1.2非参数检验预备知识 284
15.2两个配对样本的非参数检验 285
15.2.1方法原理 285
15.2.2案例:北京大学与清华大学2002年高考录取分数比较 286
15.2.3使用旧对话框分析案例 289
15.3两个独立样本的非参数检验 291
15.3.1方法原理 291
15.3.2案例:不同收入家庭经济现状感受值的比较 293
15.3.3使用旧对话框分析案例 294
15.4多个独立样本的非参数检验 295
15.4.1方法原理 296
15.4.2案例:不同时点上的家庭经济现状感受值比较 296
15.4.3使用旧对话框分析案例 299
15.5多个相关样本的非参数检验 300
15.5.1 Friedman检验 300
15.5.2案例:不同时段的世博会入园人数比较 301
15.5.3使用旧对话框分析案例 303
15.5.4 Kendall协和系数检验与Cochran检验 303
15.6秩变换分析方法 306
15.6.1秩变换分析原理简介 306
15.6.2案例:用秩变换来比较不同时点的家庭经济感受值 306
15.7本章小结 307
思考与练习 308
第16章 无序分类变量的统计推断——卡方检验 310
16.1卡方检验概述 310
16.1.1卡方检验的基本原理 310
16.1.2卡方检验的用途 311
16.1.3 SPSS中的相应功能 311
16.2单样本案例:考察抽样数据的性别分布 312
16.2.1用新对话框界面分析本案例 312
16.2.2使用旧对话框分析案例 314
16.3两样本案例:不同收入级别家庭的轿车拥有率比较 315
16.4两分类变量间关联程度的度量 318
16.4.1相对危险度与优势比 318
16.4.2案例:计算家庭收入级别和轿车拥有情况的关联程度 319
16.5一致性检验与配对卡方检验 320
16.5.1 Kappa一致性检验 320
16.5.2配对卡方检验 322
16.6分层卡方检验 322
16.7本章小结 325
思考与练习 325
第17章 相关分析 327
17.1相关分析简介 327
17.1.1相关分析的指标体系 327
17.1.2 SPSS中的相应功能 329
17.2简单相关分析 331
17.2.1方法原理 331
17.2.2案例:考察信心指数值和年龄的相关性 333
17.2.3秩相关系数 335
17.2.4 Kendall等级相关系数 336
17.3偏相关分析 336
17.3.1方法原理 336
17.3.2案例:控制家庭收入的影响之后考察年龄的作用 337
17.4 Distance过程 338
17.4.1距离测量与相似性测量的指标体系 339
17.4.2案例:基因间距离的计算 340
17.5本章小结 342
思考与练习 342
第18章 线性回归模型入门 343
18.1线性回归模型简介 343
18.1.1相关分析与回归分析的联系与区别 343
18.1.2简单回归分析的原理和要求 344
18.2案例:建立用年龄预测总信心指数值的回归方程 346
18.3多重线性回归模型入门 350
18.3.1模型简介 350
18.3.2多重线性回归模型的标准分析步骤 350
18.3.3回归方程中的自变量筛选方法 353
18.3.4 SPSS中与多重线性回归模型相关的功能 354
18.3.5案例:建立自变量包括年龄、家庭收入的信心指数回归方程 355
18.4本章小结 359
思考与练习 359
第19章 统计实战案例集锦(三) 360
19.1 X药物对原发性高血压治疗的临床试验研究 360
19.1.1项目背景 360
19.1.2研究方法 360
19.1.3数据准备 361
19.1.4基线情况比较 363
19.1.5疗效比较 366
19.1.6安全性评价 367
19.1.7分析结论与总结 369
19.2咖啡屋需求调查案例 370
19.2.1项目背景 370
19.2.2数据预分析 372
19.2.3主体问卷分析 374
19.2.4项目总结与讨论 379
19.3牙膏新品购买倾向研究案例 379
19.3.1研究背景 379
19.3.2分析思路 380
19.3.3数据预分析 381
19.3.4数据建模 384
19.3.5项目总结与讨论 387
19.4证券业市场绩效与市场结构关系的实证分析 388
19.4.1项目背景 388
19.4.2数据的采集 388
19.4.3数据预分析 389
19.4.4数据建模 390
19.4.5项目总结与讨论 392
思考与练习 393
附录 394
附录1 SPSS函数一览表 394
附录2各种情形下最常用统计检验方法索引 405
附录3统计术语英汉名词对照表 407
附录4 IBM SPSS Statistics 19/20介绍 413
参考文献 416