第1章 引言和病因概念 1
1.1 引言 2
1.2 多病因概念简史 2
1.3 科学推断简史 4
1.4 流行病学研究的关键要素 6
1.5 寻找病因 7
1.6 病因(因果)模型 8
1.7 单一暴露因果关系的反事实概念 13
1.8 因果关系的实验证据和观察证据 15
1.9 构建因果关系图 17
1.10 病因推断准则 18
参考文献 21
第2章 抽样 25
2.1 引言 26
2.2 非概率抽样 28
2.3 概率抽样 28
2.4 简单随机样本 29
2.5 系统随机样本 29
2.6 分层随机样本 29
2.7 整群抽样 29
2.8 多阶抽样 30
2.9 靶向(基于风险的)抽样 31
2.10 调查数据分析 32
2.11 样本容量的确定 34
2.12 检测疾病的抽样 40
参考文献 41
第3章 调查问卷设计 43
3.1 引言 44
3.2 问题的设计 45
3.3 开放式提问 46
3.4 封闭式提问 46
3.5 调查问卷的措辞 48
3.6 调查问卷的结构 49
3.7 预先测试调查问卷 50
3.8 调查问卷的验证 50
3.9 问卷应答率 51
3.10 资料编码和整理 51
参考文献 52
第4章 疾病频率的度量 55
4.1 引言 56
4.2 计数、比例、比数和率 56
4.3 发生(率) 57
4.4 计算风险 57
4.5 计算发生率 58
4.6 风险与率的关系 59
4.7 现患率 60
4.8 死亡统计 62
4.9 疾病频率的其他测量指标 62
4.10 标准误和置信区间 62
4.11 风险和率的标准化 63
参考文献 66
第5章 筛检试验与诊断试验 67
5.1 引言 68
5.2 试验自身属性 68
5.3 试验检测疾病或健康的能力 74
5.4 预测值 76
5.5 试验结果为连续尺度的解释 78
5.6 多重试验的应用 83
5.7 诊断试验的评价 85
5.8 无金标准时的评价 87
5.9 试验评价的其他考虑 91
5.10 样本大小的要求 92
5.11 群体水平试验 92
5.12 混合样本使用 95
参考文献 96
第6章 联系的度量 101
6.1 引言 102
6.2 联系的度量 102
6.3 效应度量 105
6.4 研究设计和联系度量 107
6.5 假设检验和置信区间 107
6.6 联系度量的多变量估计 111
参考文献 112
第7章 观察性研究导论 113
7.1 引言 114
7.2 试验设计的统一方法 115
7.3 描述性研究 117
7.4 观察性研究 118
7.5 现况研究 118
7.6 重复的现况研究与队列研究 121
参考文献 122
第8章 队列研究 125
8.1 引言 126
8.2 研究组群 127
8.3 暴露 128
8.4 保证暴露组和非暴露组的可比性 130
8.5 追踪期 131
8.6 度量结局 131
8.7 分析 132
8.8 队列研究报告 132
参考文献 134
第9章 病例-对照研究 137
9.1 引言 138
9.2 研究的基础群体 138
9.3 病例序列 139
9.4 对照选择的原则 139
9.5 基于风险设计的对照选择 140
9.6 基于率设计的对照选择 141
9.7 对照的其他来源 144
9.8 每一病例的对照数目 145
9.9 对照组的数目 145
9.10 暴露和协变量的评估 146
9.11 维持病例和对照的可比性 146
9.12 病例-对照的数据分析 146
9.13 病例-对照研究报告指南 147
参考文献 147
第10章 混合研究设计 149
10.1 引言 150
10.2 病例交叉研究 150
10.3 病例-病例研究 152
10.4 病例-序列研究 153
10.5 病例-队列研究 154
10.6 单纯病例研究 155
10.7 两阶抽样设计 156
参考文献 157
第11章 对照研究(临床试验) 159
11.1 引言 160
11.2 目的 161
11.3 研究组群 162
11.4 研究动物的分配 165
11.5 确定具体干预 167
11.6 盲法 167
11.7 跟踪/遵从 168
11.8 度量结局 169
11.9 分析 169
11.10 传染性病原预防的临床试验设计 171
11.11 伦理考虑 173
11.12 报告临床试验 174
参考文献 175
第12章 观察性研究的真实性 179
12.1 引言 180
12.2 选择偏倚 180
12.3 选择偏倚举例 182
12.4 减少选择偏倚 187
12.5 信息偏倚 188
12.6 分类错误偏倚 189
12.7 纠正错误分类的验证研究 194
12.8 度量误差 194
12.9 暴露代用度量的误差 195
12.10 信息偏倚对样本大小的影响 196
参考文献 196
第13章 混杂:检测和控制 199
13.1 引言 200
13.2 数据分析前混杂的控制 202
13.3 混杂因素匹配 202
13.4 倾向记分匹配 206
13.5 检测混杂 208
13.6 混杂的分析控制 212
13.7 控制混杂和估计因果效应的其他方法 217
13.8 控制混杂的多变量建模 221
13.9 控制混杂的工具变量 222
13.10 未度量混杂因素的外部调整和敏感性分析 223
13.11 理解因果关系 224
13.12 外来变量的总效应 232
参考文献 233
第14章 线性回归 237
14.1 引言 238
14.2 回归分析 238
14.3 假设检验和效应估计 240
14.4 X变量的性质 244
14.5 高度相关(共线性)变量的检测 248
14.6 交互作用的检测和建模 250
14.7 多变量线性模型的因果解释 251
14.8 最小二乘模型的评价 253
14.9 主要假设的评价 256
14.10 个体观察值的评价 262
14.11 时间序列数据 266
参考文献 268
第15章 建模策略 269
15.1 引言 270
15.2 建模步骤 270
15.3 建立因果模型 271
15.4 减少预测变量的数目 272
15.5 缺失值问题 276
15.6 连续预测变量的效应 277
15.7 确定有关的交互项 282
15.8 建立模型 283
15.9 模型的可靠性评价 287
15.10 结果表述 287
参考文献 289
第16章 Logistic回归 291
16.1 引言 292
16.2 Logistic模型 292
16.3 比数和比数比 293
16.4 拟合logistic回归模型 293
16.5 logistic回归假设 294
16.6 似然比统计量 295
16.7 Wald检验 296
16.8 系数的解释 296
16.9 交互作用和混杂的评价 300
16.10 建模 301
16.11 广义线性模型 302
16.12 评价Logistic回归模型 303
16.13 样本大小 311
16.14 精确logistic回归 311
16.15 配对研究的条件logistic回归 312
参考文献 315
第17章 等级数据和多项数据建模 317
17.1 引言 318
17.2 模型概述 318
17.3 多项Logistic回归 321
17.4 等级数据建模 324
17.5 比数比模型(累计约束Logit模型) 325
17.6 相邻类别模型 328
17.7 连续比模型 329
参考文献 330
第18章 计数数据和率数据的建模 331
18.1 引言 332
18.2 Poisson分布 333
18.3 Poisson回归模型 334
18.4 系数解释 334
18.5 评价Poisson回归模型 336
18.6 负二项回归 338
18.7 零计数问题 342
参考文献 346
第19章 生存数据建模 349
19.1 引言 350
19.2 非参数分析 354
19.3 精算寿命表 354
19.4 生存函数Kaplan-Meier估计 355
19.5 累积危害函数Nelson-Aalen估计 358
19.6 非参数分析的统计推断 358
19.7 生存函数、寿终函数和危害函数 360
19.8 半参数分析 364
19.9 参数模型 378
19.10 加速寿终时间模型 381
19.11 脆弱模型与聚集 384
19.12 多结果事件数据 389
19.13 离散时间生存分析 391
19.14 生存分析的样本容量 394
参考文献 395
第20章 集群数据简介 397
20.1 引言 398
20.2 由数据结构引起的集群 398
20.3 集群数据的效应 402
20.4 集群影响的模拟研究 405
20.5 处理集群的方法引论 407
参考文献 413
第21章 连续型数据的混合模型 415
21.1 引言 416
21.2 线性混合模型 416
21.3 随机斜率 421
21.4 关联效应 424
21.5 线性混合模型的统计分析 425
参考文献 433
第22章 离散数据的混合模型 435
22.1 引言 436
22.2 随机效应Logistic回归 436
22.3 随机效应Poisson回归 439
22.4 广义线性混合模型 441
22.5 广义线性混合模型的统计分析 446
22.6 离散数据集分析的总结 453
参考文献 454
第23章 重复测量数据 457
23.1 引言 458
23.2 重复测量数据的单变量和多变量方法 459
23.3 有协相关结构线性混合模型 464
23.4 不连续重复测量数据的混合模型 469
23.5 广义估计方程 472
参考文献 476
第24章 贝叶斯分析介绍 479
24.1 引言 480
24.2 贝叶斯分析 480
24.3 马尔可夫蒙特卡罗(MCMC)估计 483
24.4 MCMC估计的统计分析 486
24.5 贝叶斯和MCMC模型的拓展 489
参考文献 495
第25章 空间数据分析:引言和可视化 497
25.1 引言 498
25.2 空间数据 498
25.3 空间数据分析 500
25.4 附加语 505
参考文献 507
第26章 空间数据分析 509
26.1 引言 510
26.2 空间数据统计分析的特异问题 510
26.3 探查性空间分析 512
26.4 全局空间聚集 518
26.5 局部空间聚集检测 523
26.6 空间-时间联系 525
26.7 建模 528
参考文献 532
第27章 传染病流行病学概述 535
27.1 引言 536
27.2 感染与疾病 537
27.3 传播 538
27.4 传染病传播的数学模型 539
27.5 R0和其他传染病参数的估计 543
参考文献 551
第28章 系统评述和荟萃分析 553
28.1 引言 554
28.2 叙述性评述 554
28.3 系统评述 555
28.4 荟萃分析概述 557
28.5 固定效应模型和随机效应模型 559
28.6 结果表述 561
28.7 异质性 561
28.8 发表偏倚 568
28.9 有影响力的研究 570
28.10 结果尺度和数据问题 570
28.11 观察性研究的荟萃分析 573
28.12 诊断试验的荟萃分析 574
28.13 荟萃分析应用 575
参考文献 575
第29章 生态学与组群水平研究 579
29.1 引言 580
29.2 组群水平研究的原理 580
29.3 生态变量的类型 581
29.4 生态研究中与建模方法相关的问题 582
29.5 与推断有关的问题 583
29.6 生态偏倚的来源 583
29.7 非生态组群水平研究 586
参考文献 589
第30章 结构化数据分析方法 591
30.1 引言 592
30.2 数据收集 592
30.3 数据编码 592
30.4 数据输入 593
30.5 文档跟踪 593
30.6 变量跟踪 594
30.7 程序式与交互式数据处理 594
30.8 数据编辑 594
30.9 数据验证 596
30.10 数据处理—结果变量 596
30.11 数据处理—预测变量 596
30.12 数据处理—多水平数据 597
30.13 无条件联系 597
30.14 分析跟踪 597
第31章 数据集描述 599
词汇和术语 638