第1章 导引 1
1.1 回归与建模 1
1.2 数据收集 4
1.3 回归的用途 7
1.4 计算机的角色 7
第2章 简单线性回归 9
2.1 简单线性回归模型 9
2.2 回归参数的最小二乘估计 9
2.2.1 β0与β1的估计 9
2.2.2 最小二乘估计量的性质与回归模型拟合 13
2.2.3 σ2的估计 14
2.2.4 简单线性回归模型的另一种形式 15
2.3 斜率与截距的假设检验 15
2.3.1 使用t检验 16
2.3.2 回归显著性检验 16
2.3.3 方差分析 18
2.4 简单线性回归的区间估计 20
2.4.1 β0、β1与σ2的置信区间 20
2.4.2 响应变量均值的区间估计 21
2.5 新观测值的预测 23
2.6 决定系数 24
2.7 回归在服务业中的应用 25
2.8 使用SAS和R做回归分析 27
2.9 对回归用途的若干思考 29
2.10 过原点回归 31
2.11 极大似然估计 35
2.12 回归变量x为随机变量的情形 36
2.12.1 x与y的联合分布 36
2.12.2 x与y的正态联合分布:相关模型 37
习题 40
第3章 多元线性回归 47
3.1 多元回归模型 47
3.2 模型参数的估计 49
3.2.1 回归系数的最小二乘估计 49
3.2.2 最小二乘法的几何解释 55
3.2.3 最小二乘估计量的性质 55
3.2.4 σ2的估计 56
3.2.5 多元回归中散点图的不适用性 57
3.2.6 极大似然估计 58
3.3 多元回归中的假设检验 59
3.3.1 回归显著性检验 59
3.3.2 单个回归系数的检验与回归系数子集的检验 61
3.3.3 X中列为正交列的特例 65
3.3.4 一般线性假设的检验 66
3.4 多元回归中的置信区间 68
3.4.1 回归系数的置信区间 68
3.4.2 响应变量均值的置信区间估计 69
3.4.3 回归系数的联合置信区间 70
3.5 新观测值的预测 72
3.6 病人满意度数据的多元回归模型 73
3.7 对基本多元线性回归使用SAS与R 74
3.8 多元回归中所隐含的外推法 77
3.9 标准化回归系数 79
3.10 多重共线性 82
3.11 回归系数为什么有错误的正负号 84
习题 85
第4章 模型适用性检验 91
4.1 导引 91
4.2 残差分析 91
4.2.1 残差的定义 91
4.2.2 残差尺度化方法 92
4.2.3 残差图 97
4.2.4 偏回归图与偏残差图 100
4.2.5 使用Minitab、SAS与R做残差分析 102
4.2.6 残差的其他作图与分析方法 104
4.3 PRESS统计量 105
4.4 离群点的探测与处理 106
4.5 回归模型的失拟 108
4.5.1 失拟的正规检验 109
4.5.2 通过近邻点估计纯误差 112
习题 116
第5章 修正模型不适用性的变换与加权 120
5.1 导引 120
5.2 方差稳定化变换 120
5.3 模型线性化变换 123
5.4 选择变换的分析方法 127
5.4.1 对y进行变换:博克斯-考克斯方法 127
5.4.2 对回归变量进行变换 129
5.5 广义最小二乘与加权最小二乘 131
5.5.1 广义最小二乘 131
5.5.2 加权最小二乘 133
5.5.3 若干实用问题 133
5.6 带有随机效应的回归模型 135
5.6.1 子抽样 135
5.6.2 含有单一随机效应的回归模型的一般情形 140
5.6.3 混合模型在回归中的重要性 142
习题 142
第6章 杠杆与强影响的诊断 149
6.1 探测强影响观测值的重要性 149
6.2 杠杆 150
6.3 强影响的度量:库克D距离 152
6.4 强影响的度量:DFFITS与DFBETAS 153
6.5 模型性能的度量 155
6.6 探测强影响观测值的群体 156
6.7 强影响观测值的处理 156
习题 157
第7章 多项式回归模型 158
7.1 导引 158
7.2 单变量的多项式模型 158
7.2.1 基本原理 158
7.2.2 分段多项式拟合(样条) 162
7.2.3 多项式与三角式 166
7.3 非参数回归 167
7.3.1 核回归 167
7.3.2 局部加权回归 168
7.3.3 最后的警告 171
7.4 两个或更多变量的多项式模型 171
7.5 正交多项式 177
习题 180
第8章 指示变量 185
8.1 指示变量的一般概念 185
8.2 关于指示变量用途的评注 194
8.2.1 指示变量与指定代码回归 194
8.2.2 用指示变量代替定量回归变量 195
8.3 方差分析的回归方法 195
习题 199
第9章 多重共线性 203
9.1 导引 203
9.2 多重共线性的来源 203
9.3 多重共线性的影响 205
9.4 多重共线性的诊断 209
9.4.1 考察协方差矩阵 209
9.4.2 方差膨胀因子 212
9.4.3 X′X的特征系统分析 213
9.4.4 其他诊断量 216
9.4.5 生成多重共线性诊断量的SAS代码与R代码 217
9.5 处理多重共线性的方法 217
9.5.1 收集额外数据 217
9.5.2 模型重设 218
9.5.3 岭回归 218
9.5.4 主成分回归 225
9.5.5 有偏估计量的比较与评估 230
9.6 使用SAS做岭回归与主成分回归 231
习题 233
第10章 变量选择与模型构建 236
10.1 导引 236
10.1.1 模型构建问题 236
10.1.2 模型误设的后果 237
10.1.3 评估子集回归模型的准则 239
10.2 变量选择的计算方法 243
10.2.1 所有可能的回归 243
10.2.2 逐步回归方法 248
10.3 变量选择与模型构建的策略 252
10.4 案例研究:使用SAS研究Gorman和Toman沥青数据 254
习题 266
第11章 回归模型的验证 269
11.1 导引 269
11.2 模型验证的方法 269
11.2.1 模型系数与预测值的分析 270
11.2.2 收集新数据——确认性试验 271
11.2.3 数据分割 272
11.3 来自试验设计的数据 279
习题 280
第12章 非线性回归导引 282
12.1 线性回归模型与非线性回归模型 282
12.1.1 线性回归模型 282
12.1.2 非线性回归模型 282
12.2 非线性模型的起源 283
12.3 非线性最小二乘 285
12.4 将非线性模型变换为线性模型 287
12.5 非线性系统中的参数估计 289
12.5.1 线性化 289
12.5.2 参数估计的其他方法 294
12.5.3 初始值 295
12.6 非线性回归中的统计推断 296
12.7 非线性模型的实例 297
12.8 使用SAS与R 298
习题 301
第13章 广义线性模型 305
13.1 导引 305
13.2 逻辑斯蒂回归模型 305
13.2.1 有二值响应变量的模型 305
13.2.2 逻辑斯蒂回归模型中的参数估计 307
13.2.3 解释逻辑斯蒂回归模型中的参数 310
13.2.4 模型参数的统计推断 311
13.2.5 逻辑斯蒂回归中的诊断检验 318
13.2.6 二值响应数据的其他模型 319
13.2.7 分类回归变量的结果多于两个 320
13.3 泊松回归 321
13.4 广义线性模型 326
13.4.1 连接函数与线性预测项 326
13.4.2 GLM的参数估计与推断 327
13.4.3 使用GLM进行预测与估计 330
13.4.4 GLM中的残差分析 331
13.4.5 使用R做GLM分析 333
13.4.6 超散布性 335
习题 335
第14章 时间序列数据的回归分析 344
14.1 时间序列数据的回归模型导引 344
14.2 自相关的探测:杜宾-沃森检验 344
14.3 时间序列回归模型中的参数估计 348
习题 361
第15章 使用回归分析时的其他论题 364
15.1 稳健回归 364
15.1.1 为什么需要稳健回归 364
15.1.2 M-估计量 366
15.1.3 稳健估计量的性质 372
15.2 测量误差对回归的影响 373
15.2.1 简单线性回归 373
15.2.2 博克森模型 374
15.3 逆估计——校准问题 374
15.4 回归自助法 377
15.4.1 回归中的自助抽样 378
15.4.2 自助置信区间 378
15.5 分类回归树(CART) 382
15.6 神经网络 384
15.7 回归试验设计 386
习题 393
附录A 统计用表 395
附录B 习题数据集 406
附录C 统计方法的补充内容 425
附录D SAS导论 453
附录E R导论并用R做线性回归 461
参考文献 464
索引 479