目录 1
1 导论 1
1.1 科学方法 1
1.1.1 模式描述 2
1.1.2 模型 2
1.1.3 假说与检验 3
1.1.4 证伪的备择 4
1.1.5 统计分析的角色 5
1.2 实验与其他检验 5
1.3 数据、观察与变量 7
1.4 概率 7
1.5 概率分布 9
1.5.1 对变量的描述 10
1.5.2 统计值的分布 12
2 估计 14
2.1 样本和总体 14
2.2 常用参数和统计变量 15
2.2.1 分布的中心(位置) 15
2.2.2 离散或变异度 16
2.3 平均数的标准误差和置信区间 17
2.3.1 正态分布和中心极限定理 17
2.3.2 样本平均数的标准误 18
2.3.3 总体平均数的置信区间 19
2.3.4 总体平均数置信区间的解释 20
2.3.5 其他统计数据的标准误 20
2.4 参数估计的方法 23
2.4.1 最大似然法(ML法) 23
2.4.2 普通最小平方法(OLS) 24
2.5 估计中重复抽样的方法 25
2.5.1 自举法 25
2.4.3 ML估计与OLS估计的比较 25
2.5.2 “刀切”法 26
2.6 贝叶斯推断则——估计 27
2.6.1 贝叶斯推断的估计 27
2.6.2 先验知识和概率 28
2.6.3 似然函数 28
2.6.4 后验概率 28
2.6.5 举例 29
2.6.6 其他评论 29
3.1 统计假说检验 32
3.1.1 经典的统计假说检验 32
3 假说检验 32
3.1.2 相关概率和类型Ⅰ错误 34
3.1.3 单个总体的假设检验 35
3.1.4 单尾和双尾检验 36
3.1.5 两个总体的假设 37
3.1.6 参数检验及其假设 40
3.2 决策错误 41
3.2.1 类型Ⅰ错误和类型Ⅱ错误 41
3.2.2 不对称性和可升级的决策标准 44
3.3 其他检验方法 44
3.3.1 稳健参数检验 44
3.3.2 随机(排列)检验 45
3.3.3 基于秩的非参数检验 46
3.4.1 问题 47
3.4 多重检验 47
3.4.2 调整显著性水平和/或P值 49
3.5 统计检验结果的合并 50
3.5.1 P值合并 50
3.5.2 Meta-分析 50
3.6 对统计假说检验的批评 51
3.6.1 与样本容量和停止规则的相关性 52
3.6.2 样本空间-未观测数据的相关性 52
3.6.3 P值作为证据测度 52
3.6.4 零假设一直是假的 53
3.6.5 任意显著性水平 53
3.6.6 统计假设检验的备择方法 53
3.7 贝叶斯假设检验 54
4.1.1 探索性分析样本 57
4.1 探索性数据分析 57
4 数据的图示 57
4.2 用图进行分析 61
4.2.1 参数分析模型的假设 62
4.3 数据转换(transforming data) 63
4.3.1 转换与分布假设 64
4.3.2 转换和线性 66
4.3.3 转换和加性 67
4.4 标准化(standardizations) 67
4.5 异常值 68
4.6 删截(censored)和缺失数据(missing data) 68
4.6.1 缺失数据 68
4.6.2 删截(截尾)数据 69
4.7.1 一般事项 70
4.7 一般事项与分析提示 70
5 相关与回归 72
5.1 相关分析 72
5.1.1 参数相关模型 72
5.1.2 强相关 76
5.1.3 参数与非参数的置信区间 76
5.2 线性模型 77
5.3 线性回归分析 78
5.3.1 简单(二元)线性回归 78
5.3.2 线性模型回归 81
5.3.3 模型参数的估计 85
5.3.4 方差分析 88
5.3.5 回归中的零假设 89
5.3.6 回归模型比较 90
5.3.7 方差解释 92
5.3.8 回归分析假设 93
5.3.9 回归诊断 95
5.3.10 诊断图表 97
5.3.11 转换 99
5.3.12 通过原点的回归 100
5.3.13 加权最小平方法 101
5.3.14 X随机(二类回归模型) 102
5.3.15 稳健回归 107
5.4 回归与相关间的关系 109
5.5 修匀 110
5.5.1 移动平均值 110
5.5.2 LO(W)ESS 111
5.5.3 样条 112
5.5.4 核 112
5.5.5 其他观点 112
5.6 相关与回归检验的功效 113
5.7 分析的一般特征及其启示 113
5.7.1 一般特征 113
5.7.2 分析提示 114
6 多元与复杂回归 115
6.1 多元线性回归分析 115
6.1.1 多元线性回归模型 120
6.1.2 模型参数的估计 123
6.1.4 零假设与模型比较 125
6.1.3 方差分析 125
6.1.5 解释的方差 127
6.1.6 哪些自变量(预测变量)重要? 127
6.1.7 多元回归的假设 129
6.1.8 回归诊断法 130
6.1.9 诊断图 131
6.1.10 转换 132
6.1.11 共线性 132
6.1.12 多元回归中的交互效应 136
6.1.13 多项式回归 139
6.1.14 指示(虚拟)变量 141
6.1.15 找寻“最佳”的回归模型 142
6.1.16 等级分类 148
6.1.17 多元线性回归的其他问题 149
6.2 回归树 151
6.3 通径分析及结构方程建模 153
6.4 非线性模型 158
6.5 平滑与响应面 160
6.6 一般事项与分析提示 161
6.6.1 一般事项 161
6.6.2 分析提示 162
7 实验设计和检验功效分析 163
7.1 抽样 163
7.1.1 抽样设计 163
7.1.2 样本量 165
7.2 实验设计 165
7.2.1 重复 166
7.2.2 对照 168
7.2.3 随机化 169
7.2.4 独立 171
7.2.5 减少未解释的方差 171
7.3 检验功效分析 171
7.3.1 用检验功效设计实验(预先分析检验功效) 173
7.3.2 后检验功效计算 175
7.3.3 效应量 176
7.3.4 使用检验功效分析 177
7.4 分析的一般问题和提示 179
7.4.1 一般问题 179
7.4.2 分析提示 179
8 比较区组或处理——方差分析 180
8.1 单因素设计 180
8.1.1 预测变量(因素)的类型 184
8.1.2 单因素分析的线性模型 185
8.1.3 方差分析 192
8.1.4 零假设 194
8.1.5 对照方差分析模型 194
8.1.6 样本大小不等(不平衡的设计) 195
8.2 因素效应 196
8.2.1 随机效应:方差的组成 197
8.2.2 固定效应 198
8.3 假设 199
8.3.1 正态 200
8.3.2 方差齐次性 200
8.3.3 独立 201
8.4 方差分析诊断 202
8.5.2 Rank-based(非参数的)检验 203
8.5 强方差分析 203
8.5.1 方差不齐时的检验 203
8.5.3 随机化检验 204
8.6 平均数的特定比较 204
8.6.1 计划比较或对照 205
8.6.2 非计划的配对比较 207
8.6.3 特定的比较与非计划成对比较 210
8.7 趋势检验 210
8.8 检验组方差的相等性 212
8.9 单因素方差分析的功效 213
8.10 一般事项与分析提示 215
8.10.1 一般事项 215
8.10.2 分析提示 215
9.1 嵌套(分层hierarchical)设计 217
9 多因素方差分析 217
9.1.1 嵌套分析的线性模型 219
9.1.2 ANOVA 223
9.1.3 零假设 224
9.1.4 不等样本大小(不平衡设计) 225
9.1.5 ANOVA模型比较 225
9.1.6 嵌套式模型中的因素效应 226
9.1.7 嵌套式模型的前提 227
9.1.8 嵌套式设计详细比较 228
9.1.9 更复杂的设计 228
9.1.10 设计和功效 228
9.2 析因设计 231
9.2.1 析因设计线性模型 235
9.2.2 ANOVA 239
9.2.3 零假设 241
9.2.4 主效应和交互效应究竟测定的是什么 246
9.2.5 ANOVA模型比较 250
9.2.6 不平衡设计 251
9.2.7 因素效应 257
9.2.8 前提 259
9.2.9 可靠的析因ANOVA 260
9.2.10 主效应的特定比较 260
9.2.11 交互效应的解释 261
9.2.12 复杂析因设计 265
9.2.13 析因ANOVA的功效和设计 270
9.3 多因素设计合并 270
9.4 析因设计与嵌套设计之间的关系 271
9.5.2 分析提示 272
9.5 一般事项与分析提示 272
9.5.1 一般事项 272
10 随机区组与简单重复测量:非重复的双因素设计 273
10.1 非重复双因素实验设计 273
10.1.1 完全随机区组(RCB)设计 273
10.1.2 重复测量(RM)设计 276
10.2 分析完全随机区组(RCB)实验与重复测量(RM)实验 279
10.2.1 完全随机区组和简单重复测量分析的线性模型 279
10.2.2 方差分析 283
10.2.3 零假设 284
10.2.4 ANOVA模型比较 285
10.3 完全随机区组实验与重复测量实验中的交互作用 285
10.3.1 区组交互作用的重要处理 285
10.3.2 非典型设计的核验 288
10.4 假设 291
10.4.1 误差的正态性和独立性 291
10.4.2 方差和协方差——球形性 291
10.4.3 推荐策略 295
10.5 强完全随机区组和重复测量分析设计 295
10.6 特定比较 296
10.7 区组的效益(分组还是不分组?) 297
10.8 时间作为区组因素 298
10.9 非平衡完全随机区组实验的分析 298
10.10 完全随机区组实验与单个重复测量实验的功效 301
10.11 更复杂的区组设计 301
10.11.1 析因的随机区组设计 301
10.11.2 不完全区组设计 303
10.11.3 拉丁方设计 304
10.11.4 交叉设计 307
10.12 一般化的随机区组设计 309
10.13 完全随机区组实验和重复测量实验与统计软件 310
10.14 一般事项与分析提示 311
10.14.1 一般事项 311
10.14.2 分析提示 311
11 裂区与重复测量设计:部分嵌套的方差分析 313
11.1 部分嵌套设计(partly nested designs) 313
11.1.1 裂区设计(split-plot designs) 313
11.1.2 重复测量设计(repeated measures designs) 317
11.1.3 使用这些设计的原因 321
11.2 部分嵌套设计的分析 321
11.2.1 部分嵌套分析的线性模型 323
11.2.2 方差分析 326
11.2.3 零假设 327
11.2.4 比较方差分析模型 331
11.3 假设 331
11.3.1 区组(或对象)间 331
11.3.2 区组(或对象)内和多次抽样球形 331
11.4 部分嵌套的鲁棒分析(robust partly nested analyses) 333
11.5 特定比较 334
11.5.1 主效应 334
11.5.2 交互作用 334
11.5.3 剖面(趋势)分析 335
11.6 非平衡部分嵌套设计的分析 336
11.7 部分嵌套设计的功效 337
11.8.1 附加的区组(对象)间因素 338
11.8 更复杂的设计 338
11.8.2 附加的区组(对象)内因素 346
11.8.3 附加的区组(对象)间因素和区组(对象)内因素 350
11.8.4 复杂设计的一般评价 350
11.9 部分嵌套设计与统计软件 351
11.10 一般事项与分析提示 352
11.10.1 一般事项 352
11.10.2 个别分析提示 352
12 协方差分析 354
12.1 单因素协方差分析 354
12.1.1 协方差分析的线性模型 358
12.1.2 (协)方差分析 362
12.1.3 零假说 362
12.2 协方差分析的假设 363
12.1.4 协方差模型的比较 363
12.2.1 直线性 364
12.2.2 各组协变量值相似 364
12.2.3 固定协变量(X) 364
12.3 斜率齐性 365
12.3.1 组内回归斜率齐性的检测 365
12.3.2 组内回归斜率不同的处理 366
12.3.3 回归线的比较 367
12.4 稳健的协方差分析 368
12.5 样本量不等(不平衡设计) 368
12.6 调整均值的特殊比较 368
12.6.1 有计划的对比 368
12.7.2 析因设计 369
12.7.1 含两个或多个协变量的设计 369
12.7 更复杂的设计 369
12.6.2 无计划的对照 369
12.7.3 含一个协变量的嵌套设计 371
12.7.4 含一个协变量的部分嵌套模型 372
12.8 一般问题与分析提示 373
12.8.1 一般问题 373
12.8.2 分析提示 374
13 广义线性模型与逻辑斯谛回归 375
13.1 广义线性模型 375
13.2 逻辑斯谛回归 377
13.2.1 简单逻辑斯谛回归 377
13.2.2 多元逻辑斯谛回归 381
13.2.3 离散预测值 384
13.2.5 拟合优度和残差 385
13.2.4 逻辑斯谛回归假设 385
13.2.6 模型诊断 386
13.2.7 模型选择 387
13.2.8 逻辑斯谛回归软件 387
13.3 泊松回归 388
13.4 广义加性模型 389
13.5 相关数据模型 392
13.5.1 多水平(随机效应)模型 392
13.5.2 广义估计方程 393
13.6 一般事项和分析提示 395
13.6.1 一般事项 395
13.6.2 分析提示 395
14 频数分析 397
14.1 单变量拟合优度检验 398
14.2 列联表分析 398
14.2.1 二向表 398
14.2.2 三向表 405
14.3 对数线性模型 410
14.3.1 二向表 410
14.3.2 三向表对数线性模型 412
14.3.3 更复杂的表 416
14.4 一般事项与分析提示 416
14.4.1 一般事项 416
14.4.2 分析提示 417
15.1 多元变量数据 418
15 多元变量分析导论 418
15.2 分布与相联 419
15.3 线性组合、特征向量和特征值 421
15.3.1 变量的线性组合 421
15.3.2 特征值 422
15.3.3 特征向量 423
15.3.4 分量推导 425
15.4 多元变量距离和不相似性测度 428
15.4.1 连续变量不相似性测度 428
15.4.2 对生变量(二元变量)的不相似性测度 430
15.4.3 混合变量的一般不相似性测度 430
15.4.4 不相似性测度方法比较 430
15.5 比较距离和、或不相似性矩阵 431
15.6 数据标准化 432
15.7 标准化、相联和不相似性 433
15.8 多元变量图 434
15.9 筛选多元变量集 435
15.9.1 多元变量奇异值 435
15.9.2 缺失观测值 436
15.10 一般事项与分析提示 440
15.10.1 一般事项 440
15.10.2 分析提示 440
16 多元方差分析与判别分析 442
16.1 多元方差分析 442
16.1.1 单因素多元方差分析 445
16.1.2 特定因子比较 449
16.1.3 各因变量的相对重要性 449
16.1.4 多元方差分析的假设 451
16.1.6 更复杂的设计 452
16.1.5 鲁棒多元方差分析 452
16.2 判别函数分析 453
16.2.1 描述和假设检验 457
16.2.2 分类和预测 458
16.2.3 判别函数分析的假设 459
16.2.4 更为复杂的设计 459
16.3 多元方差分析与判别函数分析的比较 460
16.4 一般问题和分析提示 460
16.4.1 一般问题 460
16.4.2 分析提示 460
17 主成分法和对应分析 461
17.1 主成分分析 461
17.1.1 成分的提取 466
17.1.2 相伴矩阵的选择 468
17.1.3 成分的解释 469
17.1.4 成分的旋转 469
17.1.5 要保留多少成分? 470
17.1.6 假设 471
17.1.7 鲁棒主成分分析 472
17.1.8 图示 472
17.1.9 成分的其他用途 474
17.2 因子分析 476
17.3 对应分析 476
17.3.1 机制 477
17.3.2 缩放图和联合图 478
17.3.3 倒数平均 479
17.3.5 反趋势分析 480
17.3.4 对应分析在生态数据处理中的应用 480
17.4 典型相关分析 481
17.5 冗余分析 483
17.6 典型对应分析 484
17.7 约束和部分排序 488
17.8 一般问题和分析提示 489
17.8.1 概要问题 489
17.8.2 分析提示 489
18 多维排序和聚类分析 490
18.1 多维尺度分析 490
18.1.1 经典尺度分析——主坐标分析 491
18.1.2 增强多维尺度分析 493
18.1.3 不同组对象间的不相似性和假设检验 498
18.1.5 多维尺度分析与共变 503
18.1.4 多维尺度分析与原始变量 503
18.2 分类 504
18.2.1 聚类分析 504
18.3 针对生物学数据进行缩放(排序)和聚类 507
18.4 一般事项和分析提示 508
18.4.1 一般事项 508
18.4.2 分析提示 509
19 结果的展示 510
19.1 分析的展示 510
19.1.1 线性模型 510
19.1.2 其他分析 513
19.2 表的设计 513
19.3 数据的概要显示 515
19.3.1 直方图 516
19.3.2 线形图(类别分组category plot) 518
19.3.3 散点图 519
19.3.4 饼图 520
19.4 误差线 520
19.4.1 可供选择的其他方法 522
19.5 口头演讲 523
19.5.1 幻灯,电脑,或投影仪 523
19.5.2 绘图软件包 524
19.5.3 使用色彩 525
19.5.4 扫描图片 525
19.5.5 信息含量 526
19.6 一般事项与分析提示 526
参考文献 527