概述 以分析思路为导向的数据分析 1
第一章 数据分析基础与常见误区 3
第一节 基本概念:流行病学统计基础 3
一、数据 3
二、变量 3
三、总体与样本 4
四、变量的分布及其描述 4
五、总体均值的可信区间 5
第二节 回归分析:必须理解的统计方法 6
一、回归方程 6
二、回归方程与t检验、方差分析、卡方检验的关系 7
第三节 回归系数:效应大小是核心结果 9
第四节 结果解释:理解回归系数的意义 10
第五节 科研价值:将关注点从P转移到β 12
第六节 独立作用:控制混杂后的效应 13
第七节 混杂与交互的基本概念 14
一、混杂 14
二、交互作用 14
三、混杂与交互作用的区别与联系 15
第八节 筛选变量:如何获得独立作用 16
一、筛选协变量步骤和标准 18
二、常见误区 19
第九节 多个模型:从多个角度评价效应大小 20
第十节 方法表述:写SCI论文参考 21
第二章 数据库建立 23
第一节数据结构 24
一、横向数据 24
二、纵向数据 24
三、非结构化数据 25
第二节 数据表的制表原则 26
第三节 变量说明表的制表原则 27
第四节 数据库构建实例 28
第三章 科研假设与数据挖掘 33
第一节 科研假设的概念 33
一、一篇文章只说一件事 33
二、选择合适的变量 34
第二节 通过数据挖掘提出科研假设 34
一、诊断数据关联关系 34
二、扫描关联关系 38
三、快速扫描交互作用 40
第四章 数据分析思路与易侕统计软件操作 45
第一节X与Y有没有关系?是什么样的关系? 45
一、平滑曲线拟合 46
二、阈值效应或饱和效应分析 47
第二节 什么因素修饰X对Y的作用? 51
一、交互作用概念 51
二、交互作用检验 51
三、交互作用分析 52
第三节X对Y有没有独立作用?独立作用大小是多少? 56
一、如何引入协变量作用项 57
二、筛选协变量一:评价独立作用大小 57
三、筛选协变量二:交互作用检验 60
四、构建多个回归方程 63
第五章 分析流程与实例讲解 66
第一节 循环往复、逐步深入的分析流程 66
第二节 实例1:发现混杂因素与交互作用因素 67
一、数据与分析思路 67
二、软件操作与结果解释 67
三、分析流程总结与结果验证 75
第三节 实例2:系统化的分析流程 77
一、案例介绍 77
二、系统化的分析流程 77
第六章 论文实例 89
第一节 常见研究类型与分析重点 89
第二节病因学研究实例分析 90
一、论文介绍 90
二、分析思路 90
三、易侕统计软件操作 91
四、论文图表与解释 99
五、关于样本量问题的讨论 101
第七章 重复测量数据分析 105
第一节 固定的X、重复测量的Y 105
一、实例数据与分析目的 105
二、分析思路 106
三、混合效应模型分析 107
四、广义估计方程分析 109
五、混合效应模型基本原理 111
第二节 重复测量的X、重复测量的Y 112
一、实例介绍 112
二、分析思路与易侕统计软件操作 113
第三节 相加混合效应模型的优势 117
第八章 样本量估计与统计检验效率 119
第一节 抽样调查样本量的确定 119
一、原理与公式 119
二、易侕统计软件应用实例 121
第二节 假设检验样本量、检验效率与最低检测差异的计算 123
一、原理与公式 123
二、易侕统计软件应用实例 125
第三节 样本量与统计检验效率计算机模拟分析 127
一、模拟方法的介绍 127
二、病例对照研究样本量与检验效能模拟分析 127
三、两组(暴露与非暴露)比较的队列研究 132
四、横断面研究或单个队列的随访研究 135
第九章 研究设计与文献解读 141
第一节 研究类型 141
一、观察性研究和实验性研究的区别 142
二、随机对照试验研究特点 142
三、病例对照、队列研究和横断面研究的特点 142
第二节 偏倚问题 143
第三节 论文实例解读 143
一、研究背景 143
二、研究假设 144
三、研究设计与方法 144
四、病例组的选择 145
五、对照组的选择 145
六、暴露的评价 146
七、分析结果 147
八、分析技巧 149
附录一 易侕学院简介 152
附录二 易侕统计(EmpowerStats)软件 153
一、简介 153
二、软件下载与安装 154