第一章 导论与统计基础知识 1
一、关于本书各章的简介 2
(一)变量的测度等级 2
(二)本书所介绍的分析方法的概述 3
(三)本书所介绍的统计方法的分类框架 4
二、在应用统计的研究中,要以研究方法论为指导 5
(一)理论、观察、统计之间的关系 7
(二)统计研究中的常见谬误 8
(三)社会科学的研究对象和模型 11
(四)统计分析与理论分析 11
(五)真理性的检验与统计检验 12
三、基础统计原理与概念回顾 13
(一)抽样调查的定义及其相关概念 13
(二)统计推断与抽样分布 14
四、SPSS入门示范 20
(一)取得基本统计指标 21
(二)样本平均数的t检验 24
(三)方差分析 26
第二章 多元线性回归 35
一、变量的关系和回归的任务 36
二、简单线性回归模型 38
(一)简单线性回归方程 38
(二)简单回归系数的意义 39
(三)变量变换 39
(四)最小二乘估计的统计性质 41
(五)模型的假定条件 41
三、多元线性回归模型 44
(一)多元线性回归方程 44
(二)回归平面和回归系数的意义 45
(三)一般回归模型 46
(四)多元回归模型估计的统计推断 47
四、方程的拟合程度 48
(一)确定系数R2 48
(二)调整的确定系数R2 adj 49
(三)多元相关系数R 50
(四)偏确定系数 51
(五)偏相关系数 53
五、回归方程的统计检验和回归系数的推断统计 54
(一)整个回归方程的显著性检验 54
(二)偏确定系数的统计检验 57
(三)各自变量回归系数的显著性检验 57
(四)回归系数的置信区间 58
(五)回归系数不显著的原因 58
六、标准化回归系数 59
七、多元统计控制对回归系数的影响 59
八、回归预测的区间估计 62
(一)?0的区间估计 62
(二)Y0的预测 63
九、回归诊断 63
(一)异常值和权势值 64
(二)偏回归散点图 68
(三)残差正态性检验 69
(四)均方差性的检验 70
(五)共线性问题 71
(六)误差独立性问题 73
(七)非线性关系的探测 74
十、最优回归方程的选择 77
十一、标识变量在回归分析中的应用 79
(一)虚拟变量的建立与应用分析 79
(二)效应变量的建立与应用分析 86
第三章 因子分析 91
一、因子分析原理 92
(一)因子分析模型 92
(二)因子分析中的有关概念 92
(三)因子分析的步骤 94
二、求解初始因子 96
(一)主成分分析法 96
(二)公因子分析法 100
(三)因子求解方法对结果的影响 101
三、解释因子 102
(一)正交旋转方法 102
(二)斜交旋转方法 104
四、因子值及其应用 107
五、使用SPSS软件进行因子分析 110
(一)Extraction对话框 110
(二)Rotation对话框 111
(三)Scores对话框 111
(四)Descriptives对话框 111
(五)Options对话框 112
第四章 聚类分析 114
一、聚类分析的主要步骤 114
(一)选择变量 114
(二)计算相似性 115
(三)聚类 115
(四)聚类结果的解释和证实 115
二、相似性测度 115
(一)相关测度 115
(二)距离测度 117
(三)关联测度 118
(四)数据的标准化问题 119
三、聚类方法 120
(一)层次聚类法 120
(二)迭代聚类法 127
(三)分类数的确定 129
(四)聚类方法的选择 130
四、聚类结果的解释和证实 131
五、使利用SPSS软件进行聚类分析 133
(一)Hierarchical Cluster 133
(二)K-Means Cluster 134
第五章 通径分析 137
一、引言 137
二、通径模型的设置 138
三、递归通径模型与非递归通径模型 139
(一)递归通径模型 139
(二)非递归通径模型 140
(三)递归通径模型分析的假设条件 142
四、分解简单回归系数的通径分析 142
(一)外生变量对最终反应变量的各种影响 143
(二)以不同通径传递的间接影响 143
(三)在控制某些变量的条件下的总影响的分解 144
(四)标准化与非标准化的通径系数 145
(五)用列表法报告各种影响作用分解 146
五、分解简单相关系数的通径分析 147
六、通径模型的调试与检验 152
(一)通径模型的调试 152
(二)通径模型的识别 154
(三)对过度识别的通径模型的整体检验方法 156
七、示范例题 158
(一)初始通径模型 158
(二)初始模型的模拟结果 159
(三)调试模型的模拟结果 159
(四)外生变量对最终反应变量的影响分解表 160
(五)调试模型的统计检验 161
第六章 logistic回归 164
一、引言 164
二、从线性回归到logistic回归 165
(一)线性回归使用定性因变量严重违反本身假定 165
(二)线性概率模型及其问题 166
三、logistic回归模型的建立 167
(一)logistic函数及其性质 167
(二)logistic回归模型因变量的不同形式 170
四、logistic回归系数的意义 172
(一)以logit(p)方程的线性表达式来解释回归系数 172
(二)以发生比Ω的指数表达式来解释回归系数 173
(三)几种特殊情况的讨论 174
(四)标准化的logistic回归系数 176
五、logistic模型的整体评价和检验 177
(一)对于整体模型的评价 177
(二)对于整体模型的检验 178
六、logistic模型回归系数的统计检验 179
(一)回归系数的检验 179
(二)系数子集的联合假设检验 179
七、logistic回归示范例题 180
(一)自变量同时纳入模型进行回归 181
(二)含交互作用的回归 185
(三)自变量组分步纳入的回归 187
(四)自动筛选显著自变量的回归 189
八、logistic回归的扩展之一:多分类logistic回归 192
(一)多分类logistic回归原理 193
(二)多分类logistic回归示例 194
九、logistic回归的扩展之二:序次logistic回归 198
(一)序次logistic回归原理 199
(二)序次logistic回归示例 201
第七章 泊松回归 208
一、常规回归不适用于计数因变量 209
(一)导致有偏且无效的统计检验 209
(二)线性函数的不合理性 210
二、泊松分布 211
三、泊松回归 211
四、模型的参数估计 214
五、模型拟合评价与模型比较 215
(一)以残差为基础的指标 215
(二)以似然函数值为基础的指标 216
(三)以信息标准为基础的指标 216
六、模型回归系数的解释 218
(一)关注条件均值的解释 218
(二)关注预测概率的解释 219
七、统计检验与推断 220
(一)对模型整体的检验 220
(二)对回归系数的检验 221
八、示范例题 222
(一)例1:居住地区与年龄对育龄妇女曾生子女数的影响 222
(二)例2:检查纳入地区与年龄交互项的必要性 226
(三)例3:偏移量offset的设定 227
(四)例4:以泊松回归估计生育率 229
(五)例5:以泊松回归估计城乡生育率 231
(六)例6:以含交互项的泊松回归估计城乡生育率 233
(七)例7:以泊松回归估计队列生育率 234
第八章 对数线性模型 237
一、从常规交互表分析到对数线性模型分析 237
(一)传统交互表分析的缺点 237
(二)对数线性模型的发展 239
二、对数线性模型基础 239
(一)交互表的类型 239
(二)交互表的结构 240
(三)独立性的卡方检验 243
(四)交互表的对数线性模型化 244
三、例2:夫妇的教育程度匹配分析 261
(一)数据说明 261
(二)独立模型 262
(三)饱和模型 264
(四)准独立模型 269
(四)梯度婚配模型 272
(六)跨层婚配模型 273
四、对数线性模型与logistic类回归模型之间的联系 276
(一)对数线性模型与logistic回归之间的联系 276
(二)对数线性模型与多项logistic回归模型之间的联系 278
(三)对数线性模型与序次logistic回归模型之间的联系 281
第九章 多元方差分析 284
一、简介多元方差分析与一元方差分析的关系 284
二、多元方差分析的数据要求和假设条件 286
三、例题数据及三个分析模型 287
四、第一模型:单因素二元模型 288
(一)用SPSS检查因变量是否为正态分布 288
(二)SPSS多元方差分析中对单因素模型及其他检查的设置 289
(三)第一模型分析输出的结果及讨论 289
(四)关于第一模型分析的小结 293
五、多元方差分析与一元方差分析区别的图示说明 293
六、第二模型:双因素二元饱和模型 295
(一)SPSS多元方差分析中多因素饱和模型的设置 295
(二)第二模型分析输出的结果及讨论 296
七、第三模型:双因素二元非饱和模型 297
(一)SPSS多元方差分析中多因素非饱和模型的设置 297
(二)第三模型分析输出的结果及讨论 297
第十章 鉴别分析 301
一、简介 301
二、鉴别分析的假定条件和基本模型 302
(一)鉴别分析的假定条件 302
(二)鉴别分析的基本模型 303
三、例题数据说明 305
四、鉴别分析模型的各参数指标及统计检验 305
(一)非标准化鉴别系数 305
(二)标准化鉴别系数 306
(三)结构系数 307
(四)分组的矩心 308
(五)鉴别力指数 308
(六)残余鉴别力的检验 310
(七)Fisher鉴别系数 311
五、用SPSS对例题做鉴别分析的操作 312
(一)SPSS鉴别分析数据格式 312
(二)SPSS鉴别分析设置的操作 312
(三)SPSS鉴别分类结果的输出格式 313
第十一章 典型相关分析 320
一、典型相关分析思路的简介 321
二、典型相关模型的基本假设和数据要求 323
三、使用SPSS软件进行典型相关分析 324
(一)使用SPSS附带的典型相关分析命令程序进行分析 325
(二)关于两种操作方法可能取得某些统计指标的不同结果的讨论 326
四、典型相关分析的统计指标 327
(一)典型相关系数 328
(二)典型相关系数的平方 328
(三)特征值及其他有关指标 329
(四)检验典型相关系数 329
(五)典型系数 331
(六)典型负载系数 332
(七)交叉负载 333
(八)典型变量对本组观测变量总方差的代表比例 333
(九)冗余指数 335
五、关于典型冗余分析的介绍 337
六、例题分析 339
第十二章 结构方程模型 345
一、引言 345
二、应用结构方程模型分析的五个主要步骤 346
三、模型设定 346
四、模型识别 349
五、模型估计 351
六、模型评价 353
七、模型修正 357
八、AMOS结构方程模型分析的示范 357
九、附录:AMOS 7.0软件操作说明 371
(一)AMOS Graphics菜单及其常用设置 371
(二)AG常见操作介绍 374
(三)关于应用AMOS的其他几个问题 381
第十三章 事件史分析 385
一、什么是事件史分析 385
(一)传统OLS回归模型的局限性 385
(二)事件史分析概述 386
(三)删截的类型 387
(四)一些统计关系 388
(五)估计生存函数的Kaplan-Meier方法 389
二、事件史分析模型 391
(一)离散时间logit模型 392
(二)Cox比例风险模型 393
(三)其他一些连续时间模型 393
(四)关于模型的选择 395
三、事件史分析的例示范题 395
(一)例2:职位晋升分析——离散时间风险模型 395
(二)例3:初育间隔分析——Cox比例风险模型 397
(三)例4:省际迁移分析——离散时间风险模型 398
(四)例5:初育间隔分析——Cox比例风险模型 403
(五)例6和例7:初职流动分析——含随时间变化自变量的Cox比例风险模型 405
四、需要注意的问题 409
第十四章 对事件史原始数据进行预处理 414
一、输入数据类型 414
(一)用变量编排时间信息,时间变量的个数随案例而变化 415
(二)用个数相等的时间变量编排时间信息并以编码标志事件发生 415
(三)用记录编排的时间信息、时间记录不等量 415
(四)用记录编排时间信息、等量的时间变量 416
二、明确时间信息数据的处理 418
(一)例1:对第一类数据(需计算各风险期长度)的改造 418
(二)例2:对第一类数据(各风险期长度已知)的改造 421
(三)例3:对风险期案例的条件性选择及统计 422
三、隐含时间信息数据的处理 425
(一)例4:对第二类数据的改造 425
(二)例5:将第二类数据改造为含动态变量的离散时间模型数据 431
四、例6:生育史人年数据改造 439
五、讨论 443
第十五章 对应分析 446
一、什么是对应分析 446
(一)对应分析的概念与基本形式 446
(一)多元对应分析 446
(三)对应分析的基本思路 447
(四)对应分析方法的优点 448
(五)对应分析方法的局限性 448
二、对应分析的假设条件 449
(一)被调查者回答问题时并不都从同一角度(或称维度)做出判断 449
(二)所有被调查者对于某一维度重要性的评价不必一样 450
(三)被调查者的评判角度和看法可以改变 450
三、使用SPSS软件进行对应分析 450
四、对应分析示例 451
五、另一个示例:两个变量类别数都超过三类 459
附录 关于用Excel软件取得统计检验临界值的方法 466