第一章 绪论 1
1.1 引言 1
1.2 数据表的基本知识 5
1.2.1 样本点空间 6
1.2.2 变量空间 7
1.2.3 数据的标准化处理 8
第二章 一元线性回归分析 12
2.1 一元线性回归模型 12
2.1.1 回归分析所研究的问题 12
2.1.2 一元线性回归的总体模型 14
2.2 最小二乘估计方法 17
2.2.1 最小二乘估计方法的推导 17
2.2.2 高斯-马尔科夫定理 19
2.2.3 其他性质 24
2.3 拟合效果分析 25
2.3.1 残差的样本方差 26
2.3.2 测定系数 28
2.4 显著性检验 32
2.4.1 回归模型的线性关系检验 32
2.4.2 回归参数的显著性检验 36
2.4.3 残差分析 39
第三章 多元线性回归分析 42
3.1 多元线性回归模型 42
3.1.1 高斯-马尔科夫假定 42
3.1.2 最小二乘估计量 43
3.1.3 最小二乘估计量的几何意义 45
3.2 模型效果分析 45
3.2.1 残差的样本方差 45
3.2.2 复测定系数 46
3.2.3 抽样测试法 50
3.2.4 F检验 51
3.2.5 回归参数的显著性检验 52
3.3 偏相关系数 53
3.3.1 偏相关系数的定义 54
3.3.2 偏相关系数的检验 56
3.4 变量筛选方法 57
3.4.1 偏F检验 57
3.4.2 向前选择变量法 58
3.4.3 向后删除变量法 59
3.4.4 逐步回归法 59
4.1 多重相关性的含义 67
第四章 多重相关性问题 67
4.2 多重相关性的危害 70
4.3 多重相关性的论断 78
4.3.1 经验式诊断方法 78
4.3.2 方差膨胀因子 81
4.4 岭回归分析 82
4.4.1 岭回归估计量 82
4.4.2 岭回归估计量的性质 84
4.5 其他补救方法简介 88
5.1.1 主成分分析的工作目标 91
5.1 工作目标与计算方法 91
第五章 表内成分的提取方法--主成分分析 91
5.1.3 计算方法 94
5.1.4 主成分的基本性质 97
5.2 主成分分析的五个侧面 99
5.2.1 携带最多的数据变异信息 100
5.2.2 解释惯量达到最大值 100
5.2.3 最小二乘原则 102
5.2.4 样本点间的相似性改变最小 102
5.2.5 对原始变量系统有最佳的综合能力 104
5.2.6 总结 106
5.3.1 精度分析 107
5.3 辅助分析技术 107
5.3.2 解释主成分 108
5.3.3 特异点的发现 110
5.3.4 样本点在主超平面上的表现质量 112
5.3.5 数据重构 112
5.3.6 水平因子 114
5.4 变量多重相关性对主成分分析的危害 116
5.5 案例分析 119
6.1 工作目标与计算方法 125
第六章 表间成分的提取方法--典型相关分析 125
6.1.1 典型相关分析的工作目标 126
6.1.2 计算方法 128
6.2 基本性质 130
6.2.1 典型成分的直交性 131
6.2.2 相关系数之间的比例关系 132
6.2.3 相关系数矩阵的分解与重构 132
6.2.4 典型相关分析与多元线性回归分析的联系 134
6.3.1 精度分析 135
6.3 辅助分析技术 135
6.3.2 组间相关关系的结构分析 139
6.3.3 典型相关系数的显著性检验 140
6.3.4 典型成分的命名 141
6.4 案例分析 141
第七章 多因变量的偏最小二乘回归模型 150
7.1 工作目标与计算方法 150
7.1.1 工作目标 150
7.1.2 计算方法推导 152
7.1.3 交叉有效性 155
7.2 基本性质 157
7.3 一种更简洁的计算方法 164
7.3.1 提取成分的新原则 164
7.3.2 一个重要的等式 166
7.3.3 因变量对偏最小二乘成分的普通多元线性回归 168
7.3.4 偏最小二乘回归的一种简洁算法 169
7.4 案例分析 171
第八章 偏最小二乘回归的辅助分析技术 178
8.1 与典型相关分析对应的研究内容 178
8.1.1 精度分析 178
8.1.2 判断X与Y之间的相关关系 179
8.1.3 自变量xj在解释因变量集合Y时的作用 180
8.1.4 对成分的解释或命名 181
8.1.5 组间相关关系的结构分析 182
8.2 与主成分分析对应的研究内容 183
8.2.1 对样本点分布结构的观察 183
8.2.2 特异点的发现 184
8.2.3 数据重构的质量分析 185
8.3 案例分析 188
8.3.1 精度分析 188
8.3.2 判断X与Y的相关关系 192
8.3.3 xj在解释Y时的作用分析 193
8.3.4 对成分的命名 194
8.3.5 组间变量的相关关系结构 195
8.3.6 t1/t2平面图和T2椭圆 197
8.3.7 数据重构的质量分析 197
第九章 单因变量的偏最小二乘回归模型 200
9.1 工作目标与计算方法 200
9.1.1 算法推导 201
9.1.2 简化算法 204
9.1.3 基本性质 205
9.1.4 交叉有效性 206
9.2 案例分析 207
9.2.1 例题 207
9.2.2 用普通最小二乘方法建立回归模型 208
9.2.3 用偏最小二乘回归方法建立回归模型 210
9.3 对多变量信息的综合与筛选作用 212
9.4 与主成分回归的比较分析 218
9.4.1 利用主成分进行回归建模需注意的问题 219
9.4.2 偏最小二乘回归对成分提取的方式及结果 222
9.5.1 精度分析 224
9.5 辅助分析技术 224
9.5.2 偏最小二乘回归的成分 225
9.5.3 T2椭圆图 226
9.5.4 对成分的解释 229
9.5.5 数据重构的质量 231
9.5.6 关于回归方程拟合质量的观察 233
第十章 中国四类城市的经济发展分析、比较与预测模型 235
10.1 引言 235
10.2 对偏最小二乘回归分析的计算结果评价 239
10.2.2 沿海城市 242
10.2.1 大中型工业城市 242
10.2.3 江浙地区的城市 243
10.2.4 内陆中小城市 244
10.3 四类城市的经济特征比较 245
10.3.1 大中型工业城市 245
10.3.2 沿海城市 246
10.3.3 江浙地区的城市 248
10.3.4 内陆中小城市 249
10.4.1 大中型工业城市 251
10.4 对成分tk的解释与t1/t2平面图 251
10.4.2 沿海城市 253
10.4.3 江浙地区的城市 255
10.4.4 内陆中小城市 256
10.5 预测模型 259
10.5.1 大中型工业城市 259
10.5.2 沿海城市 260
10.5.3 江浙地区的城市 264
10.5.4 内陆中小城市 265
参考文献 270