第1章 引论 1
1.1 抽样调查的意义和作用 1
1.2 若干基本概念 3
1.2.1 总体与样本 3
1.2.2 概率抽样 4
1.2.3 抽样单元与抽样框 5
1.2.4 总体参数的分类 6
1.2.5 误差来源与精度表示 7
1.2.6 样本量、费用与效率 9
1.3 几种基本的抽样方法 10
1.3.1 简单随机抽样 10
1.3.2 分层抽样 10
1.3.3 整群抽样 11
1.3.4 多阶抽样 11
1.3.5 系统抽样 11
1.4 抽样调查的步骤 12
1.5 抽样调查的应用与历史发展 14
1.5.1 主要应用领域 14
1.5.2 国际发展简史 15
1.5.3 我国抽样调查的应用与发展 18
第2章 简单随机抽样 22
2.1 定义及实施方法 22
2.1.1 从一个有限总体中抽取所有可能的样本 22
2.1.2 两个等价的定义 23
2.1.3 简单随机抽样的实施方法 24
2.2 估计量及其性质 25
2.2.1 简单估计及其无偏性 25
2.2.2 估计量的方差与协方差 28
2.2.3 方差与协方差的估计 31
2.2.4 简单估计的优良性及可以进一步改进的途径 33
2.3 总体比例的估计与对子总体的估计 36
2.3.1 总体比例(百分率)的估计 36
2.3.2 子总体的估计 38
2.4 样本量的确定 41
2.4.1 确定n的一般原则 41
2.4.2 总体参数为Y或Y的一般情形 42
2.4.3 估计总体比例P的情形 43
2.4.4 总体方差的预先估计 45
2.5 放回简单随机抽样 46
2.5.1 抽样方法及基本特征 46
2.5.2 总体平均数Y估计量y的性质 47
2.5.3 设计效应(deff) 49
2.5.4 Y的另一种估计量 49
2.6 利用随机数量骰子和随机数表进行随机抽样的方法 50
2.6.1 随机数骰子及其使用方法 50
2.6.2 随机数表的使用方法 52
第3章 分层抽样 54
3.1 一般描述 54
3.1.1 定义与记号 54
3.1.2 分层抽样适用的场合与优点 55
3.2 估计量及其性质 55
3.2.2 基本性质 56
3.2.3 比例分配及自加权样本 57
3.2.4 一个简单的实验例子 59
3.3 最优分配 60
3.3.1 最优分配的定义 60
3.3.2 主要结果 61
3.3.3 Neyman(最优)分配 62
3.3.4 某些层需要超过100%抽样时的修正 64
3.4 分层随机抽样在精度上的得益 64
3.4.1 与简单随机抽样的比较 64
3.4.2 何时分层及最优分配的精度得益最大 65
3.4.3 分层随机抽样精度反比简单随机抽样差的情形 66
3.4.4 从样本估计分层随机抽样精度的得益 68
3.4.5 数值例子——关于职工月平均奖金的调查 69
3.4.6 偏离最优分配时对方差的影响 72
3.4.7 多指标情形样本量的分配 73
3.5 样本总量n的确定 75
3.5.1 估计的总体参数为Y的情形 75
3.5.2 估计的总体参数为Y的情形 78
3.6 对总体比例(百分率)的分层随机抽样 78
3.6.1 估计量及其方差 79
3.6.2 最优分配 79
3.6.3 分层和最优分配精度上的得益 79
3.6.4 样本量的估计 80
3.7 分层技术的充分利用 81
3.7.1 层的构造 81
3.7.2 多重分层 85
3.7.3 每层只抽一个单元时的方差估计 87
3.7.4 事后分层 88
3.7.5 定额抽样 91
3.8 用于分层的二相抽样 91
3.8.1 层权误差对分层估计的影响 91
3.8.2 二相抽样及估计量均值与方差的一般公式 93
3.8.3 用于分层的二相抽样的估计 96
第4章 比估计与回归估计 100
4.1 比估计及其基本性质 100
4.1.1 定义 100
4.1.2 基本性质 101
4.1.3 方差的估计 103
4.1.4 置信限 104
4.1.5 比估计与简单估计量的比较 105
4.1.6 数值例子——小麦估产调查 105
4.1.7 乘积估计 107
4.2 比估计的偏倚及其均方误差和方差估计的阶 108
4.2.1 关于有限总体样本中心矩阶的基本引理 108
4.2.2 比估计的偏倚与均方误差及其阶的估计 111
4.2.3 均方误差或方差估计的偏倚 115
4.3 分层随机抽样中的比估计 117
4.3.1 分别比估计 118
4.3.2 联合比估计 118
4.3.3 分别比估计与联合比估计的比较 120
4.3.4 分层比估计时的最优分配 121
4.3.5 数值例子——耕地面积核实调查 121
4.4 消除或减少比估计偏倚的方法 124
4.4.1 无偏的比类型估计量 125
4.4.2 减少比估计偏倚的方法 127
4.5 回归估计量(β设定时的情形) 129
4.5.1 回归估计量的一般形式 129
4.5.2 β设定情形的一般结果 129
4.5.3 差估计量 131
4.6 回归估计量(β取样本回归系数的情形) 131
4.6.1 表达式及若干引理 131
4.6.2 基本性质 135
4.6.3 回归估计量与简单估计量及比估计量的比较 138
4.7 分层随机抽样中的回归估计 139
4.7.1 分别回归估计 139
4.7.2 联合回归估计 140
4.7.3 数值例子——专业技术人员总数的调查 142
4.8 多变量比估计与回归估计 145
4.8.1 多变量比估计 145
4.8.2 多变量回归估计 147
4.8.3 数值例子——农作物估产调查 147
4.9 二相抽样中的比估计与回归估计 151
4.9.1 比估计 151
4.9.2 回归估计 152
第5章 不等概率抽样 153
5.1 一般描述 153
5.1.1 不等概率抽样的必要性 153
5.1.2 不等概率抽样的分类 154
5.2 放回不等概率抽样与Hansen.Hurwitz估计量 155
5.2.1 多项抽样、PPS抽样及其实施方法 155
5.2.2 Hansen-Hurwitz估计量及其性质 157
5.2.3 数值例子——职工人数的调查 159
5.3 不放回不等概率抽样与Horvitz-Thompson估计量 161
5.3.1 不放回不等概率抽样与包含概率 161
5.3.2 Horvitz-Thompson估计量及其性质 162
5.4 几种严格的不放回πPS抽样方法 164
5.4.1 n=2的情形 164
5.4.2 n>2的情形 167
5.5 其他不放回抽样方法及其相应的估计量 169
5.5.1 Yates-Grundy逐个抽取法及Das-Raj-Murthy估计量 169
5.5.2 Rao Hartley-Cochran方法及其估计量 173
5.5.3 Poisson抽样 174
5.5.4 配置抽样 176
5.5.5 不同抽样或估计方法性质的比较 177
第六章 整群抽样 179
6.1 引言 179
6.1.1 定义 179
6.1.2 适用场合及实施理由 179
6.1.3 群划分的原则 180
6.2 群大小相等的情形 181
6.2.1 记号 181
6.2.2 总体与样本平方和的分解 182
6.2.3 群内相关ρ0 183
6.2.4 估计量及其方差 187
6.2.5 设计效应 187
6.3 对比例估计的整群抽样 188
6.3.1 群大小相等的情形 189
6.3.2 群大小不相等的情形——比估计 189
6.4 群大小不等的一般情形 191
6.4.1 按简单随机抽样抽群——简单估计 191
6.4.2 按简单随机抽样抽群——比估计 192
6.4.3 对群进行不等概率抽样 194
6.4.4 数值例子——对交通运输量的调查 196
第7章 二阶与多阶抽样 199
7.1 引言 199
7.1.1 定义及适用场合 199
7.1.2 实施方法及同其他抽样方法的关系 200
7.2 二阶抽样——初级单元大小相等的情形 201
7.2.1 记号 202
7.2.2 估计量及其方差 203
7.2.3 最优抽样比例 205
7.2.4 数值例子——生猪存栏量的调查 206
7.2.5 关于比例的估计 208
7.2.6 分层二阶抽样 209
7.3 二阶抽样——初级单元大小不等情形(n=1) 211
7.3.1 一般说明与记号 211
7.3.2 等概率抽取初级单元 212
7.3.3 不等概率抽取初级单元 213
7.4 二阶抽样——初级单元大小不等的一般情形(n>1) 215
7.4.1 按多项抽样抽取初级单元 216
7.4.2 不放回抽样时的一般结果 220
7.4.3 按简单随机抽样抽取初级单元 223
7.4.4 按不放回不等概率抽取初级单元 224
7.5 三阶及多阶抽样 227
7.5.1 各级单元大小相等时的三阶抽样 227
7.5.2 多阶抽样中不等概率抽样的应用 229
第8章 系统抽样 232
8.1 一般描述 232
8.1.1 定义及实施方法 232
8.1.2 系统抽样与整群抽样和分层抽样的关系 233
8.1.3 系统抽样的优缺点 234
8.2 等概率系统抽样(等距抽样) 235
8.2.1 估计量 235
8.2.2 估计量的方差——用样本(群)内方差表示 235
8.2.3 估计量的方差——用样本(群)内相关表示 236
8.2.4 数值例子 237
8.3 方差与总体单元排列顺序的关系 239
8.3.1 随机排列 239
8.3.2 线性趋势 242
8.3.3 单元指标呈周期性变化的情形 243
8.3.4 单元指标呈自相关的情形 243
8.4 具有线性趋势的总体的估计量与抽样方法的改进 245
8.4.1 首尾校正法 245
8.4.2 中位样本法 246
8.4.3 对称(平衡)系统抽样法 246
8.4.4 回归估计量的应用 247
8.4.5 数值例子——部门职工总人数的估计 248
8.5 不等概率系统抽样 250
8.5.1 概述及实施方法 250
8.5.2 估计量 252
8.6 系统抽样中的方差估计 252
8.6.1 等概率系统抽样的情形 252
8.6.2 不等概率系统抽样的情形 258
第9章 复杂样本方差估计的一般方法 260
9.1 引言 260
9.1.1 复杂样本调查 260
9.1.2 方法概述 261
9.2 随机组方法 262
9.2.1 基本思想与方法 262
9.2.2 独立随机组 263
9.2.3 非独立随机组 266
8.2.4 随机组数k的选择 267
9.3 Jackknifo方法与Bootstrap方法 270
9.3.1 Jackknifo的基本思想与方法 270
9.3.2 有限总体的Jackknife方差估计 271
9.3.3 弃d-Jackknife方差估计 277
9.3.4 Bootstrap方差估计 281
9.3.5 d、r的选取及模拟次数B的确定 282
9.4 半样本方法 286
9.4.1 基本思想与方法 286
9.4.2 半样本方差估计性质 288
9.4.3 平衡半样本估计 289
9.4.4 每层多于两个样本单元情况 294
9.4.5 部分平衡半样本估计 295
9.5 Taylor级数法 296
9.5.1 估计量方差的线性近似估计 297
9.5.2 应用Taylor级数于特殊的估计量 299
9.5.3 鞍点逼近方法 301
第10章 非抽样误差及相关问题 304
10.1 无回答及其影响 305
10.1.1 无回答的类型 305
10.1.2 无回答的影响 305
10.1.3 多次访问及其模型 306
10.1.4 校正无回答误差的方法 309
10.2 调查误差 311
10.2.1 调查误差的数学模型 311
10.2.2 几种处理方法 315
10.2.3 数值异常情况 318
10.3 敏感性问题的调查 319
10.3.1 敏感性问题的调查与随机化回答 319
10.3.2 Simmons问题 320
10.3.3 数值例子 321
10.3.4 具多项选择的敏感性问题的调查 322
第11章 案例分析 325
11.1 引言 325
11.2 1991年中国5岁以下儿童死抽样调查 326
11.3 全国办公自动化设备抽样调查 330
11.4 全国粮食农药污染调查 334
11.5 1987年中国儿童情况抽样调查 344
11.6 北京地区专业技术人员现状抽样调查 351
11.7 中国1986年74城镇人口迁移抽样调查 362
11.8 中国妇女社会地位调查 370
11.9 国家卫生服务总调查 385
11.10 人口变动情况抽样调查 397
11.11 农村抽样调查网点抽选方案 402
11.12 人体测量抽样方案 408
附表 随机数表 417
参考文献 422