第1章 随机矩阵谱理论及大维数据分析 1
1.1 绪论 1
1.2 随机矩阵的谱分析 2
1.2.1 Wigner矩阵 2
1.2.2 样本协方差阵 6
1.2.3 矩阵乘积 7
1.2.4 非对称矩阵 10
1.3 大维数据分析 11
1.3.1 基本概念 11
1.3.2 关于均值的统计分析 11
1.3.3 LRT,修正的LRT以及非精确检验的模拟比较 19
1.3.4 关于变异的统计分析 23
1.3.5 大维数据变异量分析三种检验的模拟比较 25
1.3.6 大维判别分析 27
1.4 公开问题 29
1.4.1 关于样本协方差阵的Haar猜想 29
1.4.2 关于Tracy-Widom律的归一性 32
1.4.3 关于特征根间距的极限性质的归一性 34
参考文献 35
第2章 大规模数据分析及降维技术 37
2.1 引言 37
2.2 “充分”降维方法 39
2.2.1 中心降维子空间 39
2.2.2 中心均值子空间 40
2.2.3 中心方差子空间 41
2.2.4 充分降维方法的降维步骤 41
2.3 “识别”中心降维子空间 42
2.3.1 切片逆回归 42
2.3.2 切片平均方差估计 43
2.3.3 平均部分均值估计 44
2.4 “估计”中心降维子空间的基方向 45
2.4.1 “切片”估计 45
2.4.2 其他非参数估计 46
2.4.3 DEE方法 47
2.5 “估计”中心降维子空间的结构维数 50
2.5.1 序贯检验 50
2.5.2 Bayes型信息准则 51
2.6 结束语 53
参考文献 54
第3章 变系数模型 56
3.1 模型及估计方法 57
3.1.1 模型 57
3.1.2 局部线性估计 57
3.1.3 光滑样条估计 60
3.1.4 多项式样条估计 60
3.2 纵向数据分析 63
3.2.1 模型 63
3.2.2 局部核估计 63
3.2.3 局部多项式估计 66
3.2.4 光滑样条估计 67
3.2.5 最小二乘基估计 68
3.2.6 经验似然 73
3.3 变系数部分线性模型 75
3.3.1 模型 75
3.3.2 局部线性估计 76
3.3.3 一般序列估计 78
3.4 自适应变系数线性模型 81
3.4.1 模型 81
3.4.2 估计方法 82
3.5 结束语 84
参考文献 85
第4章 纵向数据模型的稳健推断 88
4.1 引言 88
4.1.1 数据结构的特征 88
4.1.2 两个例子 89
4.1.3 模型介绍 90
4.1.4 进一步阅读 91
4.2 边际模型 92
4.2.1 部分线性模型的稳健推断 92
4.2.2 广义部分线性模型的稳健推断 97
4.2.3 一些相关的问题 103
4.3 混合效应模型 104
4.3.1 广义部分线性混合效应模型的稳健推断 104
4.3.2 广义部分线性混合效应模型的稳健化似然推断 111
4.3.3 一些相关的问题 121
4.4 转移模型 121
4.5 进一步展望 122
参考文献 124
第5章 测量误差模型及其统计推断方法 128
5.1 测量误差模型简介 128
5.2 简单测量误差模型中的平均变换及估计方法 129
5.2.1 简单测量误差模型 129
5.2.2 变量的平均变换与分解卷积方法 130
5.2.3 SIMEX与EXPEX方法 131
5.3 线性测量误差模型与稳健估计方法 132
5.3.1 线性测量误差模型 132
5.3.2 参数的正交回归与M估计方法 132
5.3.3 参数的正交回归t型估计方法与EM算法 133
5.4 部分线性测量误差模型及其参数估计方法 133
5.4.1 协变量有测量误差的部分线性测量误差模型及其参数估计方法 133
5.4.2 全部变量有测量误差的部分线性测量误差模型的参数估计 134
5.4.3 有重复观测的部分线性测量误差模型及其参数估计方法 138
5.5 变系数和随机效应测量误差模型及其参数估计 140
5.5.1 变系数测量误差模型 140
5.5.2 方差比已知情况下变系数函数的估计方法 141
5.5.3 测量误差u方差已知情况下变系数函数的估计方法 143
5.5.4 随机效应测量误差模型 144
5.5.5 随机效应测量误差模型中参数的估计方法 145
5.6 有辅助变量的测量误差模型及其去噪估计方法 147
5.6.1 有辅助变量的测量误差模型 147
5.6.2 参数的去噪估计方法 147
5.7 测量误差模型中参数置信区域的经验似然构造方法 149
5.7.1 线性测量误差模型中参数置信区域的经验似然方法 149
5.7.2 部分线性测量误差模型中参数置信区域的经验似然方法 151
5.8 测量误差模型的模型检验方法 153
5.8.1 偏度和峰度正态性检验 153
5.8.2 广义线性测量误差模型 154
5.8.3 广义线性测量误差模型的模型检验方法 155
5.9 结束语 157
参考文献 157
第6章 缺失数据回归分析 164
6.1 引言 164
6.2 缺失数据分析常用的方法 165
6.2.1 似然方法 165
6.2.2 插补方法 165
6.2.3 逆概率加权方法 166
6.3 线性回归模型统计分析 167
6.3.1 插补最小二乘分析 167
6.3.2 似然因子分解分析 168
6.3.3 经验似然分析 168
6.3.4 有替代变量时缺失数据统计分析 170
6.4 非参数与参数回归模型 170
6.4.1 非参数拟似然估计 170
6.4.2 反映均值非参数估计 172
6.4.3 反映均值双稳健插补估计 173
6.5 部分线性模型统计分析 176
6.5.1 协变量缺失下模型参数与非参数部分估计 176
6.5.2 反映变量缺失下反映均值估计及模型参数与非参数部分估计 179
6.6 半参数总体模型统计分析 181
6.6.1 协变量缺失下模型参数估计 181
6.6.2 反映变量缺失下模型参数估计 183
6.7 生存分析中的缺失数据问题 185
参考文献 187
第7章 复发事件数据的统计分析 191
7.1 引言 191
7.2 复发事件中的非参数方法 193
7.2.1 联合分布函数的估计 193
7.2.2 边际生存函数的估计 195
7.2.3 事件过程均值函数的估计 196
7.3 条件回归模型 197
7.3.1 Andersen-Gill比例强度模型 197
7.3.2 Prentice-Williams-Peterson模型 199
7.3.3 复发时间风险模型 200
7.4 边际半参数模型 201
7.4.1 Wei-Lin-Weissfeld边际风险模型 201
7.4.2 Pepe和Cai比率模型 203
7.4.3 比例均值或比率模型 204
7.4.4 加性比率模型 206
7.4.5 加速回归模型 208
7.4.6 均值和强度转移模型 211
7.5 间隔时间的一些半参数模型 213
7.5.1 边际比例风险模型 213
7.5.2 边际加性风险模型 214
7.5.3 加速失效时间模型 215
7.5.4 线性转移模型 217
7.6 最近进展和潜在的研究方向 217
7.6.1 信息删失下的一些方法 217
7.6.2 其他相关问题 218
7.6.3 潜在的研究方向 220
参考文献 221
第8章 因果推断与图模型 228
8.1 引言 228
8.2 潜在结果模型 230
8.3 因果网络模型 232
8.4 替代指标问题 235
8.5 判断混杂因素的准则 242
参考文献 244
第9章 复杂疾病基因的统计关联分析 249
9.1 背景介绍 249
9.1.1 遗传学中的一些基本概念 249
9.1.2 病例对照设计 251
9.2 若干基本的检验 252
9.3 稳健检验 257
9.3.1 MAX类型检验、基因模型选择及其他方法 257
9.3.2 一个例子 260
9.4 匹配数据的关联分析 262
参考文献 265
第10章 生物医学等价性评价问题的统计推断 267
10.1 基于2×2列联表的等价性评价问题 268
10.1.1 基于两个独立二项分布的等价性评价问题 268
10.1.2 基于配对试验设计的等价性评价问题 272
10.1.3 基于多中心试验设计的等价性评价问题 278
10.1.4 基于不完全2×2列联表的等价性评价问题 280
10.2 带有结构零的2×2列联表的若干问题研究 281
10.2.1 基于RR的统计推断 282
10.2.2 基于RD的统计推断 283
10.3 3×2列联表的统计推断 284
10.4 结束语 287
参考文献 287
第11章 约束下的统计推断方法 297
11.1 多面体凸锥 297
11.1.1 凸集与凸锥 297
11.1.2 凸锥的性质 298
11.1.3 投影定理 300
11.2 保序回归与最大似然估计 301
11.2.1 问题的提出 301
11.2.2 基本定理 302
11.2.3 保序回归与最大似然估计的关系 305
11.2.4 MVA算法 308
11.3 趋势性检验 311
11.3.1 线性检验 313
11.3.2 似然比检验 317
11.3.3 线性秩模型 329
11.4 小结 331
参考文献 331
第12章 抽样调查:研究基础与未来发展 334
12.1 引言 334
12.2 无回答 335
12.3 固定样组调查 337
12.4 小域估计 338
12.4.1 基于抽样设计的小域估计方法 339
12.4.2 基于模型的小域估计 341
12.5 数据收集模式 344
12.6 二次分析 345
12.7 跨国调查 347
12.8 其他重要方面 348
12.8.1 多指标或多主题抽样与估计 348
12.8.2 计量误差 348
12.8.3 复杂的超总体模型 349
12.8.4 关于抽样误差的进一步研究 349
12.9 结束语 350
参考文献 350
第13章 试验设计和建模——计算机试验及模型未知的试验 354
13.1 古典的统计试验设计 355
13.1.1 因子试验及其部分实施 356
13.1.2 回归设计 358
13.1.3 区组设计 359
13.2 模型未知的试验和计算机试验 359
13.2.1 模型未知的试验设计 359
13.2.2 计算机试验 360
13.2.3 均匀设计的构造 361
13.2.4 建模方法 362
13.2.5 不同试验设计方法之间的关系和相互渗透 364
13.3 序贯设计 366
13.3.1 超饱和试验设计 366
13.3.2 响应曲面方法 367
13.4 结束语 368
参考文献 368
索引 374
《现代数学基础丛书》已出版书目 378