1.1 引言 1
第1章 绪论 1
1.2 数据表的基本知识 7
1.2.1 样本点空间 8
1.2.2 变量空间 9
1.2.3 数据的标准化 10
2.1 线性回归模型 14
2.1.1 回归分析所研究的问题 14
第2章 线性回归分析 14
2.1.2 线性回归的总体模型 15
2.2 最小二乘估计方法 18
2.2.1 最小二乘估计方法的推导 18
2.2.2 总体参数估计量的性质 21
2.3 模型效果分析 22
2.3.1 残差的样本方差 23
2.3.2 测定系数 24
2.4.1 回归模型的线性关系检验——F检验 28
2.4 显著性检验 28
2.4.2 回归参数的检验——t检验 31
2.5 变量筛选方法 32
2.5.1 向后删除变量法 33
2.5.2 向前选择变量法 33
2.5.3 逐步回归法 34
2.6 多重相关性问题 35
2.6.1 多重相关性的含义 35
2.6.2 多重相关性的危害 38
2.6.3 多重相关性的诊断 46
2.6.4 多重相关性的补救方法简介 50
第3章 数据表成分的提取方法 55
3.1 表内成分的提取——主成分分析 55
3.1.1 工作目标和基本思路 55
3.1.2 计算方法 58
3.1.3 主成分的基本性质 61
3.1.4 辅助分析技术 63
3.2 表间成分的提取——典型相关分析 69
3.2.1 工作目标和基本思路 70
3.2.2 计算方法 72
3.2.3 基本性质 75
3.2.4 辅助分析技术 80
3.2.5 案例分析 87
第4章 偏最小二乘回归的线性模型 97
4.1 工作目标与计算方法 97
4.1.1 工作目标 97
4.1.2 计算方法推导 98
4.1.3 交叉有效性 102
4.2 基本性质 104
4.3 单变量的偏最小二乘回归 111
4.3.1 算法推导 112
4.3.2 基本性质 115
4.3.3 交叉有效性 116
4.4 辅助分析技术 117
4.4.1 与典型相关分析对应的研究内容 117
4.4.2 与主成分分析对应的研究内容 123
第5章 偏最小二乘线性模型的案例分析——刀具磨损的预报建模 128
5.1 实验数据 128
5.2 计算过程 130
5.3 辅助分析 134
5.3.1 精度分析 134
5.3.2 自变量与因变量的相关关系分析 135
5.3.3 自变量在解释因变量时的作用 136
5.3.4 组间相关关系的结构分析 137
5.3.5 T2椭圆图与特异点的发现 138
5.3.6 数据重构的质量分析 139
5.4 结果评价 140
第6章 偏最小二乘的通径模型和递阶模型 142
6.1 结构方程模型 143
6.2 偏最小二乘通径模型 149
6.2.1 模型的设定 149
6.2.2 唯一维度的检验 152
6.2.3 模型的估计 155
6.3 多组变量集合的评估指数构建方法 158
6.4.1 工作目标和计算方法 162
6.4 递阶偏最小二乘回归模型 162
6.4.2 与偏最小二乘通径模型的比较 164
6.5 成分数据的线性回归分析方法 165
6.5.1 成分数据的概念与logratio变换 165
6.5.2 成分数据的一元线性回归方法 168
6.5.3 劳动就业结构的一元预测建模 169
6.5.4 成分数据的多元线性回归方法 172
6.5.5 劳动就业结构的多元预测建模 174
6.5.6 3个成分数据预测模型的比较分析 184
第7章 偏最小二乘回归的非线性方法 186
7.1 引言 186
7.2 拟线性回归模型分析 188
7.2.1 拟线性回归模型的一般形式 188
7.2.2 拟线性回归模型的估计问题 190
7.3 基于样条变换的偏最小二乘回归及其非线性结构分析 191
7.3.1 问题的提出 191
7.2.3 结果讨论 191
7.3.2 插值方法的相关知识 193
7.3.3 样条函数简介 195
7.3.4 基于样条变换的非线性偏最小二乘回归建模 203
7.3.5 各维自变量对因变量的非线性解释能力 206
7.3.6 仿真案例 210
7.3.7 噪声样本点的识别 212
7.4 基于核函数变换的偏最小二乘回归及其非线性结构分析 215
7.3.8 小结 215
7.4.1 核函数简介 216
7.4.2 基于核函数变换的非线性偏最小二乘回归建模 221
7.4.3 仿真案例 223
7.4.4 小结 225
7.5 案例分析 226
7.6 偏最小二乘的logistic回归模型 229
7.6.1 logistic回归模型 230
7.6.2 偏最小二乘logistic回归模型的建立 239
7.6.3 洪水灾害的模式分析 242
7.6.4 小结 247
第8章 偏最小二乘回归理论的进一步探讨 248
8.1 一种更简化的计算方法 248
8.1.1 提取成分的新原则 249
8.1.2 一个重要的等式 251
8.1.3 因变量对偏最小二乘成分的普通多元线性回归 252
8.1.4 偏最小二乘回归的一种简化算法 254
8.1.5 单因变量偏最小二乘回归的简化算法 255
8.2 偏最小二乘回归模型含义的辨识方法 257
8.2.1 问题的提出 257
8.2.2 正交旋转的空间变换方法及其性质 258
8.2.3 案例分析 263
8.3 参数检验与自变量选择的Bootstrap方法 267
8.3.1 参数检验的目的 267
8.3.2 Bootstrap方法简介 268
8.3.3 偏最小二乘回归参数检验的Bootstrap方法 271
8.3.4 案例分析 272
8.4.1 偏最小二乘回归的缺陷 275
8.4 偏最小二乘回归的缺陷和改进 275
8.4.2 一种改进的方法 276
8.4.3 加强的偏最小二乘(EPLS)回归模型 277
第9章 SIMCA-P软件使用指南 279
9.1 SIMCA-P软件概况 279
9.1.1 SIMCA-P软件的特点 279
9.1.2 SIMCA-P软件的基本术语 280
9.1.3 SIMCA-P数据分析的一般步骤 280
9.2.1 SIMCA-P软件的基本界面 282
9.2 SIMCA-P软件的分析功能与基本操作 282
9.2.2 菜单功能详解 283
9.2.3 重要功能与操作 287
9.3 SIMCA-P软件使用实例 299
9.3.1 案例背景 299
9.3.2 分析过程 301
9.3.3 结果分析 306
9.3.4 结果讨论 307
参考文献 309