第1章 绪言 1
第2章 矩阵的某些补充知识 6
2.1矩阵的某些基本知识 6
2.1.1投影矩阵 6
2.1.2常用记号 6
2.1.3方块阵的逆矩阵与行列式 7
2.1.4广义特征向量 9
2.1.5迹与特征根 10
2.1.6矩阵的因式分解与乘方 10
2.1.7特征根的极值性质 11
2.1.8矩阵的拉直运算 12
2.1.9矩阵的叉积及其性质 13
2.2矩阵的微商 14
2.3雅可比行列式 17
2.4线性子空间 18
习题2 19
第3章 多元正态分布 22
3.1定义及基本定理 22
3.2矩阵正态分布 28
3.3信息矩阵 33
3.3.1参数θ是一元时 34
3.3.2参数θ是多元时 35
3.4参数的极大似然估计 36
3.4.1极大似然估计 36
3.4.2正态分布下的极大似然估计 37
3.4.3无偏性估计 42
3.5Wishart分布 46
习题3 49
第4章 假设检验 52
4.1马氏距离、T2及Wilks统计量 52
4.1.1马氏距离 53
4.1.2 T2统计量 54
4.1.3 Wilks统计量 56
4.1.4似然比检验及其性质 58
4.2总体均值的检验与似然比统计量 59
4.2.1一元情况的回顾 59
4.2.2多元均值的检验 60
4.2.3 T2统计量与似然比统计量 61
4.3交并原则 62
4.3.1交并原则的基本原理 62
4.3.2多个单变量检验的显著性水平与多变量检验显著性水平的关系 63
4.4均值检验的线性约束 64
4.4.1一般性公式 64
4.4.2置信区域 66
4.5两总体均值差异的显著性检验 68
4.5.1协方差阵相等时 68
4.5.2协方差阵不相等时 69
4.6多总体均值的检验(多元方差分析) 71
4.6.1一元方差分析 72
4.6.2多元方差分析 73
4.7特征根统计量 77
4.8协方差阵的检验 79
4.8.1检验Σ=Σo 79
4.8.2检验Σ=σ2Σo 81
4.8.3检验Σ1=…Σk 82
4.8.4多个均值及协方差阵相等的同时检验 85
习题4 86
第5章 多元线性模型 89
5.1一元线性回归模型 89
5.2多元线性回归模型 93
5.2.1回归系数β与协方差阵Σ的极大似然估计 95
5.2.2 β与Σ的最小二乘方估计 96
5.2.3最小二乘方(OLS, LS)估计的性质 101
5.2.4最小二乘方估计的另一常用形式 102
5.3线性回归模型的假设检验 105
5.3.1线性约束下的参数估计 105
5.3.2线性约束下的假设检验 109
5.4线性模型的稳健性研究 114
5.4.1正态性条件不重要 114
5.4.2残差的等方差性有中等程度的稳健性 116
习题5 118
第6章 实用多元线性回归与典则相关分析 120
6.1多元线性回归 120
6.1.1常用的检验公式 123
6.1.2复相关系数 125
6.2变量的相对重要性及变量的选择 128
6.2.1变量的相对重要性 128
6.2.2变量的选择 131
6.3应变量的预测、线性的识别、共线性及残差分析 136
6.3.1应变量的预测 137
6.3.2残差分析 138
6.3.3寻找强影响点 139
6.3.4共线性的诊断 139
6.3.5线性回归关系的检查 140
6.4两组变量间的相关分析——典则分析 141
6.4.1一般概念 141
6.4.2基本公式 143
6.4.3典则变量个数的统计检验及变量的相对重要性 145
6.4.4变量的相对重要性 146
习题6 155
第7章 判别分析 159
7.1 Bayes线性判别法 159
7.1.1理论线性Bayes判别函数 160
7.1.2样本判别函数 162
7.2多母体线性判别函数的假设检验及变量筛选 167
7.2.1母体间差异的显著性检验 167
7.2.2母体间的马氏距离、样本估计及其检验 167
7.2.3变量的相对重要性指标及变量的筛选 168
7.3 错判率的估计 172
7.3.1使用样本的方法 173
7.3.2理论公式法 174
7.4 Fisher线性判别法 176
7.4.1判别函数及衡量其判别能力的指标 177
7.4.2判别函数的性质 178
7.5两总体判别法时的分界点 182
7.5.1两母体判别法与二值回归法的等价性 182
7.5.2分界点的选取法 183
7.6 Logistic回归 186
7.6.1模型 186
7.6.2参数的估计及检验 188
7.6.3拟合优良性指标 189
7.6.4样本类型 191
7.6.5参数的相对重要性、相对危险度与优势比 192
习题7 193
第8章 主成分分析与因子分析 197
8.1变量间的主成分分析 197
8.1.1线性主成分分析 197
8.1.2线性主成分的主要性质 198
8.1.3主成分的几何意义 201
8.1.4应取几个主成分分量及线性主成分的统计检验 203
8.1.5例题 204
8.2因子分析 206
8.2.1模型与基本公式 206
8.2.2参数的估计 209
8.2.3参数的最大似然估计与统计检验 211
8.2.4公因子的旋转(rotate) 213
8.2.5因子的得分(score) 213
8.3应用实例 214
8.3.1例题 214
8.3.2综合指标的专业方法检验 216
8.3.3因子分析结果的稳定性实例研究 217
8.3.4不相关变量之间不可以使用因子分析 218
8.3.5用统计检验估计公因子数的例子 219
习题8 220
第9章 隐变量分析 225
9.1通径图与模型 225
9.1.1通径图与通径系数 225
9.1.2模型相关系数 229
9.1.3建立在原始变量上的通径图 231
9.1.4通径图(模型)的识别(或称确认) 233
9.1.5偏相关系数的弊病 234
9.2隐变量模型及模型的拟合 235
9.2.1隐变量模型的表示形式 235
9.2.2模型的拟合 236
9.3谱系嵌套通径模型 239
9.4隐变量分析在遗传流行病学研究中的应用 244
9.4.1资料的前处理 244
9.4.2建立通径图 245
9.4.3模型的修正 248
习题9 253
第10章 聚类分析 257
10.1变量的聚类分析 258
10.1.1分类的基本思想 258
10.1.2分类的指标 259
10.2样品的系统聚类法 263
10.2.1距离 263
10.2.2类与类的特征 264
10.2.3系统聚类法 265
10.3分类指标 273
10.4大样本的动态聚类法 277
10.4.1动态聚类法 277
10.4.2聚类分析中变量的选取 279
10.5有序样品的聚类(最优分割法) 281
10.5.1基本思想及公式 282
10.5.2基本算法 283
10.5.3类数的确定 286
习题10 287
第11章 生存分析 291
11.1基本术语及公式 291
11.1.1定义及相互关系 291
11.1.2区间上危险率的估计 293
11.1.3生存函数8(t)的估计 295
11.1.4生存时间百分位数tα的估计 296
11.2常见的生存函数简介 297
11.2.1指数分布(exponential distribution) 297
11.2.2威布尔分布(Weibull distribution) 298
11.2.3对数正态分布(lognormal distribution) 299
11.2.4 Logistic分布 300
11.2.5伽玛分布(Gamma distribution) 300
11.2.6极值分布(extreme value distribution) 301
11.2.7其他的分布 301
11.3生存时间的对数线性模型 302
11.4 Cox比例危险率模型 311
11.4.1模型 311
11.4.2参数的估计和检验 312
11.4.3基线生存函数的估计 314
11.4.4残差分析 316
11.4.5对Cox比例危险率模型的检查及相对危险度 318
习题11 322
参考文献 326
附录1某些统计标准制定中的错误 330
附录2 Hotelling T2的上侧百分位点 333
附录3 M检验:检验等协方差阵的M(p,vo,k)表(α=0.05) 337