第1章 回归分析概述 1
1.1 变量间的相关关系 1
1.2 “回归”思想及名称的由来 3
1.3 回归分析的主要内容及其一般模型 5
1.3.1 回归分析研究的主要内容 5
1.3.2 回归模型的一般形式 5
1.4 回归模型的建立过程 7
1.4.1 根据目的设置指标变量 8
1.4.2 收集、整理数据 9
1.4.3 确定理论回归模型 10
1.4.4 模型参数的估计 11
1.4.5 模型的检验与改进 11
1.4.6 回归模型的应用 12
1.5 回归分析应用与发展简评 12
思考与练习 14
第2章 一元线性回归 15
2.1 一元线性回归模型 15
2.1.1 一元线性回归模型的产生背景 15
2.1.2 一元线性回归模型的数学形式 17
2.2 参数β0,β1的估计 19
2.2.1 普通最小二乘法 19
2.2.2 最大似然法 22
2.3 最小二乘估计的性质 24
2.3.1 线性 24
2.3.2 无偏性 24
2.3.3 β0,β1的方差 25
2.4 回归方程的显著性检验 26
2.4.1 t检验 27
2.4.2 F检验 28
2.4.3 相关系数的显著性检验 28
2.4.4 用R软件进行计算 31
2.4.5 三种检验的关系 35
2.4.6 样本决定系数 35
2.4.7 关于P值的讨论 36
2.5 残差分析 38
2.5.1 残差与残差图 38
2.5.2 有关残差的性质 40
2.5.3 改进的残差 40
2.6 回归系数的区间估计 41
2.7 预测和控制 42
2.7.1 单值预测 42
2.7.2 区间预测 42
2.7.3 控制问题 45
2.8 本章小结与评注 46
2.8.1 一元线性回归从建模到应用的全过程 46
2.8.2 有关回归检验的讨论 49
2.8.3 回归系数的解释 51
2.8.4 回归方程的预测 51
思考与练习 51
第3章 多元线性回归 55
3.1 多元线性回归模型 55
3.1.1 多元线性回归模型的一般形式 55
3.1.2 多元线性回归模型的基本假设 56
3.1.3 多元线性回归系数的解释 57
3.2 回归系数的估计 58
3.2.1 回归系数估计的普通最小二乘法 58
3.2.2 回归值与残差 59
3.2.3 回归系数估计的最大似然法 61
3.2.4 实例分析 62
3.3 有关估计量的性质 64
3.4 回归方程的显著性检验 68
3.4.1 F检验 68
3.4.2 t检验 70
3.4.3 回归系数的置信区间 73
3.4.4 拟合优度 74
3.5 中心化和标准化 74
3.5.1 中心化 75
3.5.2 标准化回归系数 75
3.6 相关阵与偏相关系数 77
3.6.1 样本相关阵 77
3.6.2 偏决定系数 78
3.6.3 偏相关系数 79
3.7 本章小结与评注 82
3.7.1 多元线性回归的建模过程 82
3.7.2 评注 84
思考与练习 87
第4章 违背基本假设的几种情况 90
4.1 异方差性产生的背景和原因 90
4.1.1 异方差性产生的原因 90
4.1.2 异方差性带来的问题 91
4.2 一元加权最小二乘估计 92
4.2.1 异方差性的诊断 92
4.2.2 一元加权最小二乘估计 96
4.2.3 寻找最优权函数 97
4.3 多元加权最小二乘估计 101
4.3.1 多元加权最小二乘法 101
4.3.2 权函数的确定方法 101
4.4 自相关性问题及其处理 103
4.4.1 自相关性产生的背景和原因 104
4.4.2 自相关性带来的问题 105
4.4.3 自相关性的诊断 105
4.4.4 自相关问题的处理 109
4.4.5 自相关实例分析 110
4.5 BOX-COX变换 115
4.6 异常值与强影响点 119
4.6.1 关于因变量y的异常值 119
4.6.2 关于自变量x的异常值对回归的影响 120
4.6.3 异常值实例分析 121
4.7 本章小结与评注 123
4.7.1 异方差问题 123
4.7.2 自相关问题 124
4.7.3 异常值问题 125
思考与练习 125
第5章 自变量选择与逐步回归 129
5.1 自变量选择对估计和预测的影响 129
5.1.1 全模型与选模型 129
5.1.2 自变量选择对预测的影响 130
5.2 所有子集回归 131
5.2.1 所有子集的数目 131
5.2.2 自变量选择的几个准则 132
5.2.3 用R软件寻找最优子集 136
5.3 逐步回归 138
5.3.1 前进法 138
5.3.2 后退法 141
5.3.3 逐步回归法 142
5.4 本章小结与评注 145
5.4.1 逐步回归实例 145
5.4.2 评注 149
思考与练习 150
第6章 多重共线性的情形及其处理 153
6.1 多重共线性产生的背景和原因 153
6.2 多重共线性对回归建模的影响 154
6.3 多重共线性的诊断 156
6.3.1 方差扩大因子法 157
6.3.2 特征根判定法 158
6.3.3 直观判定法 160
6.4 消除多重共线性的方法 160
6.4.1 剔除不重要的解释变量 160
6.4.2 增大样本量 163
6.4.3 回归系数的有偏估计 163
6.5 本章小结与评注 163
思考与练习 165
第7章 岭回归 166
7.1 岭回归估计的定义 166
7.1.1 普通最小二乘估计带来的问题 166
7.1.2 岭回归的定义 167
7.2 岭回归估计的性质 168
7.3 岭迹分析 169
7.4 岭参数k的选择 170
7.4.1 岭迹法 171
7.4.2 方差扩大因子法 171
7.4.3 由残差平方和确定k值 172
7.5 用岭回归选择变量 172
7.6 本章小结与评注 179
思考与练习 180
第8章 主成分回归与偏最小二乘 182
8.1 主成分回归 182
8.1.1 主成分的基本思想 182
8.1.2 主成分的基本性质 183
8.1.3 主成分回归的实例 184
8.2 偏最小二乘 187
8.2.1 偏最小二乘的原理 187
8.2.2 偏最小二乘的算法 190
8.2.3 偏最小二乘的应用 191
8.3 本章小结与评注 194
思考与练习 196
第9章 非线性回归 197
9.1 可化为线性回归的曲线回归 197
9.2 多项式回归 203
9.2.1 几种常见的多项式回归模型 203
9.2.2 应用实例 204
9.3 非线性模型 206
9.3.1 非线性最小二乘 206
9.3.2 非线性回归模型的应用 207
9.3.3 其他形式的非线性回归模型 218
9.4 本章小结与评注 218
思考与练习 220
第10章 含定性变量的回归模型 223
10.1 自变量含定性变量的回归模型 223
10.1.1 简单情况 223
10.1.2 复杂情况 226
10.2 自变量含定性变量的回归模型与应用 226
10.2.1 分段回归 226
10.2.2 回归系数相等的检验 230
10.3 因变量是定性变量的回归模型 232
10.3.1 定性因变量的回归方程的意义 232
10.3.2 定性因变量回归的特殊问题 233
10.4 Logistic回归模型 233
10.4.1 分组数据的Logistic回归模型 233
10.4.2 未分组数据的Logistic回归模型 236
10.4.3 Probit回归模型 239
10.5 多类别Logistic回归 241
10.6 因变量顺序类别的回归 243
10.7 本章小结与评注 245
思考与练习 247
部分练习题参考答案 252
附录 262
表1 简单相关系数临界值表 262
表2 t分布表 263
表3 F分布表 264
表4 DW检验上下界表 270
参考文献 272