第一篇 医学科研数据的处理方法 1
第一章 多个数据集的横向检查 1
第一节 多个数据集变量的汇总报告 2
第二节 多个数据集观测对象的汇总报告 5
第二章 数据的清错和报告 9
第一节 数据集中重复记录的检查和清除 9
第二节 数据集中重复编码的检查和清除 11
第三节 数据集中重复测量记录数的统计 13
第四节 正态分布的连续变量异常值查找和清除 15
第五节 偏态分布的连续变量异常值查找和清除 17
第六节 数据中变量有效观测数的统计 18
第七节 两个数据集的比较 20
第三章 数据和变量的预处理 23
第一节 多个数据集的合并 23
第二节 变量长度的改变 25
第三节 数据中数值型变量与字符型变量的相互转换 27
第四节 分类变量重新分类 29
第五节 连续型变量等分转换成等级变量 31
第六节 连续型变量按百分位值分组 33
第七节 重复测量值均数的计算 35
第一节 家系数据家庭成员关系编码的检查 40
第四章 家系结构数据的处理 40
第二节 家系数据家庭成员年龄关系的检查 41
第三节 家系结构汇总报告 43
第四节 根据家系结构挑选家系 45
第五节 根据某一表型从家系中挑选极端(或患病)同胞对 46
第六节 家系数据结构的转换 48
第二篇 医学科研数据的分析方法 51
第五章 数据的基本描述与单因素分析 51
第一节 自动计算数据集中所有变量的分布 55
第二节 连续变量的均数、标准差与百分位数 59
第三节 分类变量的交叉频数分布与卡方检验 61
第四节 均数的比较——t检验与单因素方差分析 63
第五节 均数的比较——两因素方差分析 66
第六节 多个分类变量联合的频数分布 70
第七节 多个二分类事件各种交叉发生的频率统计 74
第六章 线性回归与Logistic回归分析(一) 76
第一节 单个暴露因子的线性回归分析 80
第二节 单个暴露因子的Logistic回归分析 86
第三节 多个暴露因子的回归分析 88
第四节 两个或多个暴露因子的交互作用的分析 92
第五节 重复测量数据GEE分析方法 98
第七章 线性回归与Logistic回归分析(二) 102
第一节 其它分布类型因变量的回归分析 103
第二节 大批量危险因子的分析 108
第三节 筛选预测模型分析 112
第四节 连续变量的曲线拟合分析 114
第五节 寿命表与COX回归模型分析 117
第八章 多元分析与重复测量数据分析 123
第一节 异常病例的发现 123
第二节 两样本多元比较的T2检验 125
第三节 多样本多元比较的方差分析 127
第四节 两样本因变量反应曲线图分析 129
第五节 混合效应(MIXED)模型分析因变量反应曲线图 131
第六节 混合效应(MIXED)模型分析重复测量数据 136
第九章 家系研究表型数据的相关分析 139
第一节 组内相关系数的计算 142
第二节 运用双生子数据计算遗传度 143
第三节 同胞之间受累相对危险度估计 145
第四节 残差与校正值的计算 147
第十章 家系研究基因型与表型的关联分析 150
第一节 家系基因数据的孟德尔检错 151
第二节 等位基因的Hardy-Weinberg平衡检验 153
第三节 以家系为单位的关联分析 155
第四节 病例—父母三人资料的TDT分析 161
第五节 同胞数据SDT分析 163
第六节 对数线性模型用于病例—父母三结构资料的关联分析 165
第七节 多位点基因的单倍体型构建 169
第八节 病例与对照多位点基因单倍体频率卡方检验 173
第三篇 文章实例分析 177
第十一章 如何建立数据的分析思路 177
第一节 建立数据分析思路的目的和意义 177
第二节 建立数据分析思路的前提条件 178
第三节 建立数据分析思路需要考虑的几个问题 178
第一节 了解数据中变量的类型 181
第二节 数据描述与分析方法的选择 181
第十二章 数据描述与分析方法的选择 181
第十三章 文章实例分析 187
第一节 “Exposure to Benzene,Occupational Stress,and Reduced Birth Weight”文章分析 187
第二节 “Genetic Susceptibility to Benzene and Shortened Gestation:Evidence of Gene-Environment Interaction”文章分析 193
第三节 “A Candidate Gene Association Study on Preterm Delivery:Application ofHigh-throughput Genotyping Technology and Advanced Statistical Methods”文章分析 198
第四节 “Maternal Cigarette Smoking,Metabolic Gene Polymorphism,and Infant Birth Weight”文章分析 205
第五节 “Polymorphisms of the Paraoxonase Gene and Risk of Preterm Delivery”文章分析 216
第六节 “Preconception Homocysteine and B-vitamin Status and Birth Outcomes in Chinese Women”文章分析 221
第七节 “Low Preconception Body Mass Index is Associated with Birth Outcome in a Prospective Cohort of Chinese Women”文章分析 229
第八节 “Prospective Study of Exposure to Environmental Tobacco Smoke and Dysmenorrhea”文章分析 235
第九节 “Tofu Consumption and Blood Lead Levels in Young Chinese Adults”文章分析 242
主要参考书目 249