第1章 引言 1
1.1 关于样本的争论 1
1.2 优良样本的必要条件 2
1.3 选择偏差 4
1.4 测量偏差 7
1.5 问卷设计 9
1.6 抽样与非抽样误差 13
1.7 练习 15
第2章 简单概率样本 20
2.1 概率样本的类型 20
2.2 概率抽样的框架 22
2.3 简单随机抽样 27
2.4 置信区间 32
2.5 样本量的估计 35
2.6 系统抽样 39
2.7 简单随机抽样的随机化定理结果 40
2.8 简单随机抽样模型 42
2.9 什么时候使用简单随机抽样 45
2.10 练习 46
第3章 比率估计和回归估计 54
3.1 比率估计 55
3.1.1 为什么要使用比率估计 56
3.1.2 比率估计量的偏倚及均方误差 60
3.1.2.1 MSE近似值的准确度 65
3.1.2.2 比率估计的优势 66
3.1.3 比例的比率估计 67
3.2 回归估计 69
3.2.1 使用线性模型 69
3.2.2 差值估计 72
3.3 域估计 73
3.4 比率估计和回归估计模型 77
3.4.1 比率估计模型 77
3.4.2 回归估计的一个模型 81
3.4.3 基于模型估计量与基于设计估计量的差异 83
3.5 比较 83
3.6 练习 84
第4章 分层抽样 89
4.1 什么是分层抽样 89
4.2 分层抽样的理论 92
4.3 抽样权重 97
4.4 将观测值分配到层中 98
4.4.1 比例分配 98
4.4.2 最优分配 100
4.4.3 层内设定精度的分配 102
4.4.4 样本量的确定 103
4.5 定义层 103
4.6 分层抽样的一个模型 106
4.7 事后分层 107
4.8 定额抽样 108
4.9 练习 111
第5章 等概率整群抽样 122
5.1 整群抽样的符号 125
5.2 1阶整群抽样 126
5.2.1 规模相等的群:估计 126
5.2.2 规模相等的群:理论 129
5.2.3 规模不等的群 134
5.2.3.1 无偏估计 134
5.2.3.2 比率估计 135
5.3 2阶整群抽样 136
5.4 整群样本中权数的应用 144
5.5 整群样本的设计 145
5.5.1 PSU规模的选择 146
5.5.2 子抽样规模的选择 147
5.5.3 样本规模(PSU数目)的选择 150
5.6 系统抽样 150
5.7 整群抽样的模型 154
5.7.1 基于模型的估计 156
5.7.2 基于模型的设计 159
5.8 小结 160
5.9 练习 161
第6章 不等概率抽样 170
6.1 抽选一个初级抽样单元 172
6.2 1阶放回抽样 175
6.2.1 选择初级抽样单元 176
6.2.1.1 累积规模方法 176
6.2.1.2 Lahiri方法 177
6.2.2 估计理论 178
6.2.3 选择概率的设计 180
6.3 2阶放回抽样 183
6.4 无放回不等概率抽样 185
6.4.1 Horvitz-Thompson估计量 187
6.4.2 不等概率样本的权数 189
6.4.3 一般无放回设计下的Horvitz-Thompson估计量 189
6.5 不等概率抽样的例子 190
6.6 随机化理论结果和证明 196
6.7 模型和不等概率抽样 201
6.8 练习 203
第7章 复杂调查 211
7.1 设计成分的整合 211
7.1.1 调查中区组的构造 211
7.1.2 复杂调查中的比率估计 214
7.1.3 调查设计的简化 215
7.2 抽样权重 215
7.2.1 抽样权重的构造 215
7.2.2 自加权与非自加权样本 217
7.2.3 调查数据的权重与基于模型的分析 218
7.3 分布函数的估计 218
7.4 复杂调查数据的图示 225
7.5 设计效应 229
7.5.1 设计效应与置信区间 230
7.5.2 设计效应与样本量 231
7.6 全国犯罪受害者调查 231
7.7 抽样与试验设计 237
7.8 练习 238
第8章 无回答 244
8.1 忽略无回答的后果 245
8.2 设计调查以减少非抽样误差 247
8.3 回访与二相抽样 250
8.4 无回答机制 252
8.5 无回答加权调整方法 253
8.5.1 加权组调整 254
8.5.2 事后分层 256
8.5.2.1 权事后分层 256
8.5.2.2 搜索调整法 257
8.5.3 估计回答概率:其他方法 259
8.5.4 关于加权的注意事项 260
8.6 插补 260
8.6.1 演绎插补 262
8.6.2 单元格均值插补 262
8.6.3 热卡插补 263
8.6.4 回归插补 263
8.6.5 冷卡插补 264
8.6.6 替代法 264
8.6.7 多重插补 265
8.6.8 插补的优势与缺陷 265
8.7 无回答的参数模型 266
8.8 可接受的回答率是多少 269
8.9 练习 270
第9章 复杂调查中的方差估计 276
9.1 线性化(Taylor级数)方法 276
9.2 随机组方法 280
9.2.1 调查设计的复制 280
9.2.2 将样本划分为随机组 283
9.3 再抽样与复制方法 285
9.3.1 平衡重复复制(BRR) 285
9.3.1.1 分层随机样本中的BRR 285
9.3.1.2 分层多阶调查中的BRR 289
9.3.2 Jackknife方法 292
9.3.3 Bootstrap方法 294
9.4 广义方差函数 296
9.5 置信区间 298
9.5.1 总体总量的光滑函数的置信区间 298
9.5.2 总体分位数的置信区间 299
9.5.3 条件置信区间 301
9.6 总结和软件 302
9.7 练习 303
第10章 复杂调查中的分类数据分析 307
10.1 多项抽样的卡方检验 307
10.1.1 因素的独立性检验 309
10.1.2 比例的齐性检验 310
10.1.3 拟合优度检验 311
10.2 关于卡方检验的调查设计效应 313
10.2.1 复杂调查数据的列联表分析 314
10.2.2 对于假设检验和置信区间的影响 315
10.3 卡方检验的校正 317
10.3.1 Wald检验 317
10.3.2 Bonferroni检验 320
10.3.3 与卡方分布的矩进行匹配 321
10.3.4 基于模型的卡方检验方法 323
10.4 对数线性模型 325
10.4.1 多项抽样的对数线性模型 325
10.4.2 复杂调查中的对数线性模型 327
10.5 练习 330
第11章 复杂调查数据的回归 336
11.1 简单随机抽样下基于模型的回归 337
11.2 复杂调查中的回归 341
11.2.1 点估计 342
11.2.2 标准误 345
11.2.2.1 用线性化方法估计标准误 345
11.2.2.2 用Jackknife方法估计标准误 347
11.2.3 矩阵形式的多元回归 348
11.2.4 使用权数的回归与加权最小二乘 349
11.2.5 复杂调查的回归分析软件 350
11.3 在回归中应该使用权数吗 350
11.4 整群样本的混合模型 355
11.5 Logistic回归 357
11.6 总体总量的广义回归估计 358
11.7 练习 361
第12章 抽样中的其他论题 365
12.1 二相抽样 365
12.1.1 二相抽样理论 367
12.1.2 二相抽样的比率估计 369
12.1.3 用于分层的二相抽样 370
12.2 捕获-再捕获估计 373
12.2.1 捕获-再捕获试验的列联表 375
12.2.2 N的置信区间 376
12.2.3 利用名单应用捕获-再捕获方法 377
12.2.4 多重再捕获估计 379
12.3 对域估计的再次讨论 383
12.3.1 复杂调查中的域均值 383
12.3.2 小区域估计 384
12.4 稀有事件抽样 386
12.4.1 按不等比例分配的分层抽样 386
12.4.2 二相抽样 387
12.4.3 多抽样框调查 387
12.4.4 网络抽样 388
12.4.5 滚雪球抽样 389
12.4.6 序贯抽样 389
12.4.7 稀有总体抽样中的无回答 390
12.5 随机化回答 390
12.6 练习 392
附录Ⅰ 抽样中使用的概率概念 399
Ⅰ.1 概率 399
Ⅰ.2 随机变量与期望值 402
Ⅰ.3 条件概率 406
Ⅰ.4 条件期望 408
附录Ⅱ 数据集 412
附录Ⅲ 示例中使用的计算机代码 424
附录Ⅳ 统计表 432
参考文献 434