第1章 基本概念 1
1.1 非参数统计概念与产生 1
1.2 假设检验回顾 5
1.3 经验分布和分布探索 10
1.3.1 经验分布 10
1.3.2 生存函数 12
1.4 检验的相对效率 15
1.5 分位数和非参数估计 18
1.6 秩检验统计量 21
1.7 U统计量 24
1.8 实验 29
习题 34
第2章 单一样本的推断问题 37
2.1 符号检验和分位数推断 37
2.1.1 基本概念 37
2.1.2 大样本计算 41
2.1.3 符号检验在配对样本比较中的应用 43
2.1.4 分位数检验——符号检验的推广 44
2.2 Cox-Staut趋势存在性检验 45
2.3 随机游程检验 49
2.4 Wilcoxon符号秩检验 52
2.4.1 基本概念 52
2.4.2 Wilcoxon符号秩检验和抽样分布 55
2.5 单组数据的位置参数置信区间估计 61
2.5.1 顺序统计量位置参数置信区间估计 61
2.5.2 基于方差估计法的位置参数置信区间估计 64
2.6 正态记分检验 68
2.7 分布的一致性检验 71
2.7.1 x2拟合优度检验 71
2.7.2 Kolmogorov-Smirnov正态性检验 75
2.7.3 Liliefor正态分布检验 76
2.8 单一总体渐近相对效率比较 77
2.9 实验 80
习题 87
第3章 两独立样本数据的位置和尺度推断 90
3.1 Brown-Mood中位数检验 91
3.2 Wilcoxon-Mann-Whitney秩和检验 93
3.3 Mood方差检验 99
3.4 Moses方差检验 101
3.5 实验 103
习题 106
第4章 多组数据位置推断 108
4.1 试验设计和方差分析的基本概念回顾 108
4.2 Kruskal-Wallis单因素方差分析 115
4.3 Jonckheere-Terpstra检验 122
4.4 Friedman秩方差分析法 126
4.5 随机区组数据的调整秩和检验 131
4.6 Cochran检验 133
4.7 Durbin不完全区组分析法 136
4.8 案例 138
习题 143
第5章 分类数据的关联分析 145
5.1 r×s列联表和x2独立性检验 145
5.2 x2齐性检验 147
5.3 Fisher精确性检验 148
5.4 Mantel-Haenszel检验 151
5.5 关联规则 153
5.5.1 关联规则基本概念 153
5.5.2 Apriori算法 154
5.6 Ridit检验法 156
5.7 对数线性模型 162
5.7.1 对数线性模型的基本概念 163
5.7.2 模型的设计矩阵 168
5.7.3 模型的估计和检验 169
5.7.4 高维对数线性模型和独立性 170
5.8 案例 173
习题 177
第6章 秩相关和分位数回归 181
6.1 Spearman秩相关检验 181
6.2 KendallΤ相关检验 185
6.3 多变量Kendall协和系数检验 189
6.4 Kappa一致性检验 192
6.5 中位数回归系数估计法 194
6.5.1 Brown-Mood方法 194
6.5.2 Thcil方法 196
6.5.3 关于α和β的检验 197
6.6 线性分位回归模型 199
6.7 案例 202
习题 207
第7章 非参数密度估计 209
7.1 直方图密度估计 209
7.1.1 基本概念 209
7.1.2 理论性质和最优带宽 211
7.1.3 多维直方图 213
7.2 核密度估计 213
7.2.1 核函数的基本概念 213
7.2.2 理论性质和带宽 215
7.2.3 多维核密度估计 218
7.2.4 贝叶斯决策和非参数密度估计 221
7.3 κ近邻估计 224
7.4 案例 225
习题 232
第8章 一元非参数回归 234
8.1 核回归光滑模型 235
8.2 局部多项式回归 237
8.2.1 局部线性回归 237
8.2.2 局部多项式回归的基本原理 239
8.3 LOWESS稳健回归 240
8.4 κ近邻回归 241
8.5 正交序列回归 243
8.6 罚最小二乘法 245
8.7 样条回归 246
8.7.1 模型 246
8.7.2 样条回归模型的节点 247
8.7.3 常用的样条基函数 248
8.7.4 样条模型的自由度 250
8.8 案例 251
习题 254
第9章 数据挖掘与机器学习 255
9.1 一般分类问题 255
9.2 Logistic回归 256
9.2.1 Logistic回归模型 257
9.2.2 Logistic回归模型的极大似然估计 258
9.2.3 Logistic回归和线性判别函数LDA的比较 259
9.3 κ近邻 261
9.4 决策树 262
9.4.1 决策树基本概念 262
9.4.2 CART 264
9.4.3 决策树的剪枝 265
9.4.4 回归树 266
9.4.5 决策树的特点 266
9.5 Boosting 268
9.5.1 Boosting方法 268
9.5.2 AdaBoost.M1算法 268
9.6 支持向量机 271
9.6.1 最大边距分类 271
9.6.2 支持向量机问题的求解 273
9.6.3 支持向量机的核方法 275
9.7 随机森林树 277
9.7.1 随机森林树算法的定义 277
9.7.2 随机森林树算法的性质 277
9.7.3 如何确定随机森林树算法中树的节点分裂变量 278
9.7.4 随机森林树的回归算法 279
9.7.5 有关随机森林树算法的一些评价 279
9.8 多元自适应回归样条 280
9.8.1 MARS与CART的联系 282
9.8.2 MARS的一些性质 282
9.9 案例 283
习题 294
附录A R基础 297
A.1 R基本概念和操作 298
A.1.1 R环境 298
A.1.2 常量 299
A.1.3 算术运算 299
A.1.4 赋值 300
A.2向量的生成和基本操作 300
A.2.1 向量的生成 300
A.2.2 向量的基本操作 302
A.2.3 向量的运算 305
A.2.4 向量的逻辑运算 305
A.3 高级数据结构 306
A.3.1 矩阵的操作和运算 306
A.3.2 数组 308
A.3.3 数据框 308
A.3.4 列表 309
A.4数据处理 309
A.4.1 保存数据 309
A.4.2 读入数据 310
A.4.3 数据转换 311
A.5编写程序 311
A.5.1 循环和控制 311
A.5.2 函数 312
A.6 基本统计计算 313
A.6.1 抽样 313
A.6.2 统计分布 313
A.7 R的图形功能 314
A.7.1 plot函数 315
A.7.2 多图显示 315
A.8 R帮助和包 317
A.8.1 R帮助 317
A.8.2 R包 317
习题 317
附录B常用统计分布表 321
参考文献 362