第一章 导论 1
1 概述 1
1.1 问题的提出 1
1.2 缺失数据产生的原因 2
1.3 缺失数据的模式 3
2 缺失数据机制 4
2.1 完全随机缺失 5
2.2 随机缺失 7
2.3 取决于协变量缺失 8
2.4 非随机缺失 9
2.5 取决于随机影响缺失 10
2.6 取决于前期数据的缺失 10
2.7 总结 11
3 缺失数据研究综述 11
3.1 缺失数据研究的几个阶段 11
3.2 缺失数据问题的前沿性研究 14
4 本书的结构 16
第二章 加权调整方法 20
1 加权调整方法基本思想 20
1.1 应用背景 20
1.2 加权调整法的基本思想 21
2 几种加权调整方法 22
2.1 Politz-Simmons调整法 22
2.2 加权组调整法 24
2.3 再抽样调整法 27
2.4 事后分层调整法 28
2.5 迭代调整法 30
2.6 校准法 32
2.7 双重稳健加权法 40
3 加权调整法中辅助信息的利用 42
3.1 辅助信息的一般问题 42
3.2 利用辅助信息划分调整组 45
3.3 利用辅助信息构造最终权数 47
4 加权调整估计量的偏差及方差 48
4.1 加权组调整估计量的偏差和方差 48
4.2 事后分层调整估计量的偏差和方差 50
4.3 加权调整后估计量方差的控制 50
5 案例分析 52
5.1 数据来源 52
5.2 缺失数据机制分析 52
5.3 加权组调整 53
5.4 再抽样加权调整 55
5.5 加权组调整基础上的事后分层调整 55
5.6 结果比较与分析 56
第三章 插补方法 58
1 插补方法基本思想 58
1.1 应用背景 58
1.2 插补方法的分类 59
1.3 插补方法基本思想 59
2 几种单一插补方法 60
2.1 均值插补 60
2.2 演绎插补 62
2.3 比率插补 63
2.4 回归插补 64
2.5 最近距离插补 64
2.6 热卡插补 66
2.7 冷卡插补 70
2.8 随机插补 73
2.9 双重稳健插补法 75
3 插补法中辅助信息的利用 77
3.1 利用辅助信息划分插补层 78
3.2 利用辅助信息构造插补值 79
3.3 模型中辅助信息的利用 80
4 案例分析 85
4.1 研究方法 85
4.2 一些结论 86
4.3 实证分析 88
第四章 参数似然方法 93
1 MAR下的参数似然分析 93
2 MAR和单调缺失下的估计 95
2.1 一维变量情形 95
2.2 二维变量情形 96
2.3 多维变量情形 98
3 MAR下的EM算法 99
3.1 EM算法的基本思想 99
3.2 收敛性及例子 102
3.3 非单调缺失数据 105
4 信息矩阵和在MAR下的方差估计 108
5 不可忽略缺失机制下的参数似然方法 111
第五章 纵向或层次数据的处理方法 114
1 MAR下的处理方法:单调或依协变量缺失情形 114
2 基于前期数据的非单调缺失的处理方法 116
2.1 三种不同处理方法 116
2.2 基于前期数据的非单调缺失下的插补模型 117
2.3 非参数回归插补 120
2.4 降维 121
2.5 模拟结果 123
3 取决于随机效应的缺失机制下的处理方法 126
3.1 存在的三种方法 127
3.2 整群抽样下的分组方法 129
3.3 汇总统计量 132
3.4 模拟结果 135
4 案例分析 138
4.1 威斯康星糖尿病登记研究 138
4.2 肾脏疾病的饮食调整 139
第六章 方差估计 144
1 直接推导法 144
1.1 近似公式 144
1.2 一般方法 148
1.3 最近距离插补 153
2 多重插补法 155
3 重抽样法 161
3.1 刀切法 161
3.2 平衡半样本方法 166
3.3 自助法 172
4 案例分析 173
4.1 多重插补法 174
4.2 刀切法 176
4.3 平衡半样本法 177
4.4 自助法 178
5 总结 180
参考文献 182