第1篇 统计学基础 3
第1章 统计学内容概述 3
1.1 统计学整体架构 3
1.2 统计思想概述 3
1.3 科研设计架构 4
1.4 统计表达与描述概述 5
1.5 统计分析方法概述 5
1.6 以框图形式呈现科研设计 5
1.6.1 实验设计的内容概要 6
1.6.2 临床试验设计的内容概要 7
1.6.3 调查设计的内容概要 7
1.7 以表格形式呈现统计分析方法的选择 9
1.7.1 定量资料统计分析方法的选择 9
1.7.2 定性资料统计分析方法的选择 10
1.7.3 多重回归分析中统计分析方法的选择 10
1.7.4 多元统计分析方法的选择 11
第2章 资料的类型及其表达与描述 12
2.1 资料类型的划分 12
2.1.1 传统划分法 12
2.1.2 现代划分法 12
2.1.3 资料类型划分方法的本质 13
2.1.4 资料类型的转换 13
2.2 定量资料的表达与描述 13
2.2.1 对称分布资料的统计描述 14
2.2.2 非对称分布资料的统计描述 17
2.2.3 其他常用统计描述指标 18
2.3 定性资料的统计描述 21
2.3.1 二分类资料的描述 21
2.3.2 多分类资料的描述 22
2.3.3 相对数 22
2.4 正态分布及其应用 25
2.4.1 正态分布的概念 26
2.4.2 正态分布的性质 26
2.4.3 正态分布的应用 28
2.5 统计表 31
2.5.1 统计表的构成及要求 32
2.5.2 统计表的种类 32
2.6 统计图 32
2.6.1 统计图的构成及要求 33
2.6.2 常用的统计图类型及其应用 33
第2篇 科研设计 41
第3章 科研设计要览 41
3.1 科研设计概述 41
3.1.1 何为科研设计 41
3.1.2 科研设计的重要性 41
3.1.3 科研设计的正确指导思想 41
3.1.4 科研设计的组成 43
3.1.5 完善的科研设计的标志 43
3.2 统计研究设计概述 43
3.2.1 统计研究设计的知识点 43
3.2.2 统计研究设计的共性 44
3.2.3 统计研究设计的特性 44
3.2.4 统计研究设计的要领和精髓 44
3.2.5 统计研究设计类型 45
3.3 临床试验设计和调查设计要点概述 48
3.3.1 临床试验设计要点 48
3.3.2 调查设计要点概述 49
3.4 实验或调查研究过程中的质量控制 49
3.4.1 实验研究过程中的质量控制 49
3.4.2 调查研究过程中的质量控制 49
第4章 实验设计要览 50
4.1 实验设计的意义与原理 50
4.1.1 意义 50
4.1.2 原理 50
4.2 实验设计中不可回避的基本概念 50
4.2.1 因素与水平 51
4.2.2 组别与处理 51
4.2.3 指标、项目与效应 52
4.2.4 变量、自变量与因变量 53
4.2.5 交互作用、协同作用与拮抗作用 53
4.2.6 平衡设计与非平衡设计 54
4.3 实验设计的三要素 55
4.3.1 实验因素 55
4.3.2 受试对象 55
4.3.3 实验效应 55
4.4 实验设计的四原则 56
4.4.1 随机原则 56
4.4.2 对照原则 56
4.4.3 重复原则 57
4.4.4 均衡原则 57
4.5 实验设计类型 57
第5章 临床科研设计要览 59
5.1 临床科研的类型 59
5.1.1 何为临床科研 59
5.1.2 调查某些疾病的发病率或人群分布规律 59
5.1.3 为某些医学指标制定参考值范围或为某些疾病的诊断与治疗制定标准 60
5.1.4 评价某治疗方法或药物的有效性与安全性的研究 61
5.1.5 探查某些疾病的发病原因的研究 61
5.1.6 基因治疗研究 61
5.2 临床试验研究 61
5.2.1 伦理问题 61
5.2.2 分期问题 61
5.2.3 依从性问题 62
5.2.4 盲法设计问题 62
5.3 确定临床试验研究中的三要素 62
5.3.1 合理选定受试对象 62
5.3.2 确定和安排影响因素 64
5.3.3 正确选定观测指标 66
5.4 落实临床试验研究中的四原则 68
5.4.1 随机原则 68
5.4.2 对照原则 76
5.4.3 重复原则 77
5.4.4 均衡原则 78
5.5 临床试验研究中设计类型的确定与变形 78
5.6 临床试验研究成组设计中三类特殊比较类型所需样本含量的估计 79
5.6.1 三种特殊比较类型的概述 79
5.6.2 非劣效性试验所需样本含量的估计 80
5.6.3 等效性试验所需样本含量的估计 82
5.6.4 优效性试验所需样本含量的估计 85
第3篇 临床科研中使用频率极高的统计分析方法第6章 多个同类研究资料的meta分析 91
6.1 什么样的资料值得进行meta分析 91
6.2 多个成组设计定量资料的meta分析 91
6.3 多个成组设计定性资料的meta分析 94
第7章 两种方法测量结果一致性的评价 100
7.1 两种方法(或两个评价者)定量测定结果之间一致性评价 100
7.1.1 问题与数据结构 100
7.1.2 实例解析 100
7.2 两种方法(或两个评价者)定性测定结果之间一致性评价 106
7.2.1 问题与数据结构 106
7.2.2 实例解析 107
第8章 诊断试验中寻求高灵敏度与特异度的ROC曲线分析 111
8.1 诊断试验中常用的统计指标 111
8.1.1 评价诊断试验真实性的指标 111
8.1.2 评价诊断试验可靠性的指标 113
8.1.3 评价诊断试验的其他指标 113
8.1.4 评价诊断试验的常用指标计算实例 114
8.2 ROC曲线分析及其本质 115
8.2.1 ROC曲线分析简介 115
8.2.2 诊断试验准确性评价指标的局限性 115
8.2.3 ROC曲线的构建 116
8.2.4 ROC分析的准确性评价指标 116
8.2.5 其他与ROC分析有关的问题 117
8.2.6 ROC曲线分析的本质 118
8.3 如何实现ROC曲线分析 118
8.4 如何进行ROC曲线比较 123
第9章 临床试验研究中三类特殊试验设计资料的统计分析 125
9.1 成组设计定量资料 125
9.1.1 非劣效性检验 125
9.1.2 等效性检验 126
9.1.3 优效性检验 128
9.2 成组设计定性资料 129
9.2.1 非劣效性检验 129
9.2.2 等效性检验 131
9.2.3 优效性检验 133
第4篇 差异性分析 139
第10章 单因素设计定量资料的统计分析 139
10.1 单组设计定量资料的统计分析 139
10.1.1 问题与数据 139
10.1.2 实例解析 139
10.1.3 设计类型简介 143
10.1.4 统计分析方法 143
10.2 配对设计定量资料的假设检验 145
10.2.1 问题与数据 145
10.2.2 实例解析 146
10.2.3 设计类型简介 149
10.2.4 统计分析方法 149
10.3 单因素两水平设计(成组设计)定量资料的统计分析 150
10.3.1 问题与数据 150
10.3.2 实例解析 150
10.3.3 设计类型简介 154
10.3.4 统计分析方法 155
10.4 单因素k水平(k≥3)设计定量资料的统计分析 156
10.4.1 问题与数据 156
10.4.2 实例解析 157
10.4.3 设计类型简介 163
10.4.4 统计分析方法 164
10.5 单因素设计一元定量资料统计分析的其他内容 165
10.5.1 正态性检验 165
10.5.2 方差齐性检验 166
10.5.3 单因素k水平设计一元定量资料组间均数差别的多重比较 167
第11章 多因素设计定量资料的统计分析 168
11.1 随机区组设计定量资料的统计分析 168
11.1.1 问题与数据 168
11.1.2 实例解析 168
11.1.3 设计类型简介 171
11.1.4 统计分析方法 172
11.2 析因设计定量资料的统计分析 173
11.2.1 问题与数据 173
11.2.2 实例解析 173
11.2.3 设计类型简介 176
11.2.4 统计分析方法 176
11.3 嵌套设计定量资料的统计分析 177
11.3.1 问题与数据 177
11.3.2 实例解析 178
11.3.3 设计类型简介 179
11.3.4 统计分析方法 180
11.4 重复测量设计定量资料的统计分析 181
11.4.1 问题与数据 181
11.4.2 实例解析 183
11.4.3 设计类型简介 194
11.4.4 统计分析方法 194
第12章 单因素设计定性资料的统计分析 196
12.1 横断面研究设计的2×2表资料 196
12.1.1 问题与数据 196
12.1.2 实例解析 196
12.1.3 设计类型简介 198
12.1.4 假设检验方法 198
12.1.5 假设检验的步骤 199
12.2 队列研究设计的2×2表资料 199
12.2.1 问题与数据 199
12.2.2 实例解析 200
12.2.3 设计类型简介 201
12.2.4 假设检验方法 202
12.2.5 假设检验的步骤 202
12.3 病例-对照研究设计的2×2表资料 202
12.3.1 问题与数据 202
12.3.2 实例解析 203
12.3.3 设计类型简介 204
12.3.4 假设检验方法 204
12.3.5 假设检验的步骤 205
12.4 配对研究设计的2×2表资料 205
12.4.1 问题与数据 205
12.4.2 实例解析 206
12.4.3 设计类型简介 207
12.4.4 假设检验方法 208
12.4.5 假设检验的步骤 208
12.5 双向无序的R×C表资料 209
12.5.1 问题与数据 209
12.5.2 实例解析 209
12.5.3 设计类型简介 211
12.5.4 统计分析方法 211
12.6 结果变量为有序变量的单向有序R×C表资料 211
12.6.1 问题与数据 211
12.6.2 实例解析 212
12.6.3 设计类型简介 214
12.6.4 统计分析方法 214
12.7 双向有序且属性不同的R×C表资料 214
12.7.1 问题与数据 214
12.7.2 实例解析 215
12.7.3 设计类型简介 217
12.7.4 统计分析方法 217
12.8 双向有序且属性相同的R×C表资料 218
12.8.1 问题与数据 218
12.8.2 实例解析 218
12.8.3 设计类型简介 219
12.8.4 统计分析方法 219
12.9 原因变量为有序变量的R×2表资料 220
12.9.1 问题与数据 220
12.9.2 实例解析 220
12.9.3 设计类型简介 223
12.9.4 统计分析方法 223
12.10 结果变量为有序变量的2×C表资料 224
12.10.1 问题与数据 224
12.10.2 实例解析 224
12.10.3 设计类型简介 225
12.10.4 统计分析方法 226
第13章 多因素设计定性资料的统计分析 227
13.1 结果变量为二值变量的高维列联表资料 227
13.1.1 问题与数据 227
13.1.2 实例解析 227
13.1.3 设计类型简介 233
13.1.4 统计分析方法 233
13.2 结果变量为多值名义变量的高维列联表资料 233
13.2.1 问题与数据 233
13.2.2 实例解析 234
13.2.3 设计类型简介 239
13.2.4 统计分析方法 239
13.3 结果变量为多值有序变量的高维列联表资料 239
13.3.1 问题与数据 239
13.3.2 实例解析 240
13.3.3 设计类型简介 242
13.3.4 统计分析方法 243
13.4 具有重复测量设计的高维列联表资料 243
13.4.1 问题与数据 243
13.4.2 实例解析 243
13.4.3 设计类型简介 245
13.4.4 统计分析方法 245
第5篇 变量之间相互与依赖关系的统计分析第14章 简单线性相关与回归分析 249
14.1 问题与数据 249
14.2 实例解析 251
14.3 基本概念 254
14.4 简单线性相关分析 254
14.4.1 直线相关系数r的计算 254
14.4.2 直线相关系数的假设检验 255
14.4.3 总体相关系数ρ的置信区间 255
14.5 Spearman秩相关分析 255
14.5.1 秩相关系数rs的计算 255
14.5.2 秩相关系数的假设检验 256
14.6 简单线性回归分析 256
14.6.1 回归方程的计算 256
14.6.2 回归系数的假设检验 257
14.6.3 总体回归系数β的置信区间 257
14.6.4 总体均数μγ1x的置信区间和个体Y值的预测区间 257
14.7 简单线性相关和回归分析的联系与区别 258
14.7.1 简单线性相关和回归分析的联系 258
14.7.2 简单线性相关和回归分析的区别 258
14.8 应用简单线性相关和回归分析时的注意事项 259
14.8.1 同质性问题 259
14.8.2 应以专业知识为依据 259
14.8.3 绘制散点(布)图 259
第15章 多重线性回归与多重logistic回归分析 260
15.1 多重线性回归分析 260
15.1.1 问题与数据 260
15.1.2 实例解析 261
15.1.3 基本概念 266
15.1.4 多重线性回归方程中的参数估计 267
15.1.5 回归方程和偏回归系数的假设检验 267
15.1.6 自变量的筛选方法 267
15.1.7 回归诊断方法 269
15.1.8 自变量作用大小的评价 270
15.1.9 回归方程拟合效果的评价 270
15.2 多重logistic回归分析 271
15.2.1 问题与数据 271
15.2.2 实例解析 271
15.2.3 基本概念 274
15.2.4 Logistic回归方程的参数估计和假设检验 274
15.2.5 多重logistic回归分析中自变量的筛选方法 275
15.2.6 回归模型的拟合优度检验 275
第6篇 临床科研设计与统计分析中常见错误辨析与释疑第16章 统计表达与描述错误辨析与释疑 279
16.1 平均指标与变异指标应用中存在的问题 279
16.1.1 误用正态分布法描述偏态分布资料 279
16.1.2 误用标准误作为变异指标描述定量资料 280
16.2 相对数应用中存在的问题 280
16.2.1 计算相对数时分母过小 280
16.2.2 以“率”代替“比” 282
16.2.3 数据的含义不明确 283
16.3 统计表的编制中存在的问题 284
16.3.1 统计表主谓语颠倒 284
16.3.2 主次纵标目颠倒 285
16.3.3 同一张表中表达多个不同的内容 287
16.4 统计图的绘制中存在的问题 288
16.4.1 误用复式条图表达应该使用线图表达的资料 288
16.4.2 统计图坐标轴上的刻度值不符合数学原则 289
第17章 实验设计错误辨析与释疑 290
17.1 受试对象选取方面存在的问题 290
17.2 与“四原则”有关的错误案例 291
17.2.1 实验设计违反随机原则和均衡原则 291
17.2.2 实验设计违反均衡原则 292
17.2.3 实验设计违反对照原则 293
第18章 定量资料统计分析方法应用错误辨析与释疑 296
18.1 误用x2检验处理定量资料 296
18.1.1 误用于处理具有一个重复测量的两因素设计定量资料 296
18.1.2 误用于处理单因素多水平设计定量资料 296
18.2 忽视参数检验的前提条件 297
18.3 误用配对设计定量资料t检验处理非配对设计定量资料 297
18.3.1 误用于处理成组设计定量资料 297
18.3.2 误用于处理具有一个重复测量的单因素设计定量资料 298
18.3.3 误用于处理具有一个重复测量的两因素设计定量资料 299
18.4 误用成组设计定量资料t检验 301
18.4.1 误用于处理单因素多水平设计定量资料 301
18.4.2 误用于处理具有一个重复测量的两因素设计定量资料 302
18.4.3 误用于处理具有一个重复测量的三因素设计定量资料 303
18.4.4 误用于处理具有两个重复测量的两因素设计定量资料 304
18.5 误用t检验处理非单组、非配对、非成组设计定量资料 305
18.5.1 误用于处理具有两个重复测量的三因素设计定量资料 305
18.5.2 误用于处理两因素析因设计或嵌套设计定量资料 306
18.5.3 误用于处理多因素非平衡组合实验定量资料 308
18.6 误用成组设计定量资料U检验 310
18.6.1 误用于处理具有一个重复测量的两因素设计定量资料 310
18.6.2 误用于处理单因素多水平设计定量资料 310
18.7 误用配对设计和成组设计定量资料t检验处理多因素设计定量资料 311
18.8 误用单因素多水平设计定量资料方差分析处理多因素 312
18.8.1 误用于处理具有一个重复测量的两因素设计定量资料 312
18.8.2 误用于处理具有一个重复测量的三因素设计定量资料 313
18.8.3 误用于处理具有两个重复测量的两因素设计定量资料 314
18.8.4 误用于处理具有两个重复测量的三因素设计定量资料 315
18.8.5 误用于处理具有三个重复测量的四因素设计定量资料 316
18.8.6 误用于处理两因素析因设计或嵌套设计定量资料 317
18.8.7 误用于处理多因素非平衡组合实验定量资料 319
第19章 定性资料统计分析方法应用中的错误辨析与释疑 321
19.1 忽视一般x2检验的前提条件 321
19.2 误用x2检验分析结果变量为有序变量的单向有序列联表资料 322
19.3 根据x2检验下相关性结论 322
19.4 误用x2检验处理配对设计定性资料 323
19.5 误用校正的x2检验取代Fisher精确检验 324
19.6 误用Spearman秩相关分析取代一般x2检验 324
19.7 误用x2检验处理结果变量为多值有序变量的高维列联表资料 325
19.8 误用x2检验处理结果变量为多值名义变量的高维列联表资料 325
19.9 误用x2检验处理结果变量为二值变量的高维列联表资料 326
19.10 误用x2检验处理具有重复测量设计的高维列联表资料 326
19.12 误用t检验处理定性资料 328
19.13 未进行统计分析便得出结论 328
19.14 误用Spearman秩相关分析取代一致性检验 329
19.15 误用Wilcoxon秩和检验处理定性资料 329
19.16 列表格式错误导致无法进行一致性检验 330
第20章 相关与回归分析方法应用错误辨析与释疑 331
20.1 简单线性相关与回归分析中的错误辨析与释疑 331
20.1.1 相关分析中违反同质性原则 331
20.1.2 未绘制散点(布)图就盲目进行相关分析 332
20.1.3 相关性分析的结果与结论不吻合 332
20.1.4 散点(布)图不呈直线趋势,仍进行线性相关分析 332
20.1.5 盲目地进行包含异常点数据的相关与回归分析 333
20.1.6 未对截距和斜率进行假设检验 334
20.1.7 对定性变量或非正态变量进行直线相关分析 334
20.2 多重回归分析中的错误辨析与释疑 335
20.2.1 多重logistic回归分析变量筛选策略错误 335
20.2.2 多重回归分析中只使用一种自变量筛选方法 338
20.2.3 最终的多重logistic回归方程中包含无统计学意义的自变量 339
20.2.4 未对定性变量赋哑变量 340
20.2.5 使用logistic回归分析处理结果变量为定量变量的资料 342
20.2.6 使用多重线性回归分析结果变量为定性变量的资料 343
20.2.7 多重回归模型中使用P值大小评价各自变量的作用 344
参考文献 345
附录 胡良平统计学专著及其配套软件简介 346