第Ⅰ部分 基本概念 3
第1章 引言 3
1.1 美国佛罗里达Everglades湿地案例 5
1.2 统计学问题 7
1.3 参考文献说明 10
第2章 R语言 11
2.1 什么是R语言? 11
2.2 开始使用R语言 11
2.2.1 R提示符与赋值 12
2.2.2 数据类型 13
2.2.3 R的函数 15
2.3 R Commander 17
第3章 统计假设 24
3.1 正态性假设 24
3.2 独立性假设 28
3.3 等方差假设 29
3.4 探索性数据分析 30
3.4.1 展示分布的图形 30
3.4.2 比较分布的图形 32
3.4.3 识别变量间依存关系的图形 34
3.5 从图形到统计学思维 41
3.6 参考文献说明 43
第4章 统计推断 44
4.1 总体均值和置信区间的估计 45
4.1.1 估计标准误的自举法 51
4.2 假设检验 55
4.2.1 t检验 56
4.2.2 双侧备择 62
4.2.3 用置信区间进行假设检验 63
4.3 一般过程 64
4.4 假设检验的非参数方法 65
4.4.1 秩变换 66
4.4.2 Wilcoxon符号秩检验 66
4.4.3 Wilcoxon秩和检验 68
4.4.4 关于分布无关检验方法的讨论 69
4.5 置信水平α、统计功效1-β和p值 73
4.6 单因素方差分析 80
4.6.1 方差分析 81
4.6.2 统计推断 82
4.6.3 多重比较 85
4.7 案例 89
4.7.1 美国佛罗里达Everglades湿地案例 90
4.7.2 Kemp的鳞龟 91
4.7.3 水质达标评价 96
4.7.4 红树林和海绵体之间的相互作用 99
4.8 参考文献说明 104
第Ⅱ部分 统计建模 107
第5章 线性模型 107
5.1 作为线性模型的ANOVA 110
5.2 简单和多元线性回归模型 113
5.2.1 最小平方法 113
5.2.2 鱼样本中的PCBs 114
5.2.3 用一个预测变量来回归 116
5.2.4 多元回归 118
5.2.5 相互作用 119
5.2.6 残差和模型评估 121
5.2.7 类型预测变量 128
5.2.8 芬兰湖泊案例和共线性 132
5.3 构建预测性模型的一般考虑 140
5.4 模型预测的不确定性 144
5.5 双因素ANOVA 146
5.5.1 相互作用 151
5.6 参考文献说明 153
第6章 非线性模型 154
6.1 非线性回归 154
6.1.1 分段线性模型 162
6.1.2 案例:美国丁香花初次开花的日期 168
6.2 平滑 171
6.2.1 散点图平滑 171
6.2.2 拟合局部回归模型 173
6.3 平滑和加性模型 174
6.3.1 加性模型 175
6.3.2 加性模型的拟合 177
6.3.3 北美湿地数据库 179
6.3.4 讨论:科学中非参数回归模型的作用 182
6.3.5 时间序列的季节分解 186
6.4 参考文献说明 194
第7章 分类和回归树 196
7.1 美国俄勒冈Willamette河案例 196
7.2 统计学方法 199
7.2.1 种植和修剪一棵回归树 201
7.2.2 种植和修剪一棵分类树 208
7.2.3 绘图选项 212
7.3 讨论 214
7.3.1 将CART用做建模工具 214
7.3.2 离差平方和与概率假设 217
7.3.3 CART和生态阈值 218
7.4 参考文献说明 219
第8章 广义线性模型 221
8.1 逻辑斯蒂回归 222
8.1.1 案例:评估将紫外线作为饮用水消毒剂的有效性 223
8.1.2 统计学问题 223
8.1.3 在R中拟合模型 224
8.2 模型解释 227
8.2.1 逻辑特变换 227
8.2.2 截距 227
8.2.3 斜率 228
8.2.4 其他的预测变量 228
8.2.5 相互作用 230
8.2.6 对隐孢子虫案例的讨论 231
8.3 诊断学 232
8.3.1 箱式残差图 232
8.3.2 偏大离差 233
8.4 啮齿动物食用种子:逻辑斯蒂回归的第二个案例 235
8.5 泊松回归模型 248
8.5.1 中国台湾西南部的砷数据 248
8.5.2 泊松回归 250
8.5.3 暴露和偏移 254
8.5.4 偏大离差 255
8.5.5 相互作用 258
8.5.6 泊松回归与逻辑斯蒂回归 265
8.5.7 负二项分布 267
8.6 广义加性模型 269
8.6.1 案例:西南极半岛的鲸 271
8.7 参考文献说明 280
第Ⅲ部分 高级统计建模 285
第9章 用于模型检验和统计推断的模拟 285
9.1 模拟 285
9.2 用模拟来概括线性和非线性回归 287
9.2.1 一个入门案例 287
9.2.2 概括线性回归模型 290
9.2.3 用于模型评估的模拟 295
9.3 基于重采样的模拟 300
9.3.1 自举聚合 301
9.3.2 案例:基于CART的阈值的置信区间 302
9.4 参考文献说明 305
第10章 多层回归 306
10.1 多层结构和可交换性 306
10.2 多层ANOVA 309
10.2.1 食用潮间海藻的动物 310
10.2.2 农田的N20背景释放量 314
10.2.3 何时使用多层模型? 318
10.2.4 双因素ANOVA 319
10.3 多层线性回归 326
10.3.1 非嵌套分组 337
10.3.2 多元回归问题 342
10.4 广义多层模型 351
10.4.1 利物浦飞蛾——一个逻辑斯蒂回归案例 351
10.4.2 美国饮用水中的隐孢子虫——一个泊松回归案例 356
10.4.3 采用模拟手段来检验模型 360
10.5 参考文献说明 366
参考文献 367
索引 374