第1章 R基础 1
1.1R基本概念和操作 2
1.1.1R环境 2
1.1.2常量 3
1.1.3算术运算 3
1.1.4赋值 4
1.2向量的生成和基本操作 4
1.2.1向量的生成 4
1.2.2向量的基本操作 6
1.2.3向量的运算 9
1.2.4向量的逻辑运算 9
1.3高级数据结构 10
1.3.1矩阵的操作和运算 10
1.3.2数组 12
1.3.3数据框 12
1.3.4列表 13
1.4数据处理 13
1.4.1保存数据 13
1.4.2读入数据 14
1.4.3数据转换 15
1.5编写程序 15
1.5.1循环和控制 15
1.5.2函数 16
1.6基本统计计算 17
1.6.1抽样 17
1.6.2统计分布 17
1.7R的图形功能 18
1.7.1plot函数 19
1.7.2多图显示 19
1.8R帮助和包 21
1.8.1R帮助 21
1.8.2R包 21
习题 21
第2章 基本概念 25
2.1非参数统计概念与产生 25
2.2假设检验回顾 29
2.3经验分布和分布探索 34
2.3.1经验分布 34
2.3.2生存函数 36
2.4检验的相对效率 39
2.5分位数和非参数估计 42
2.6秩检验统计量 46
2.7U统计量 48
习题 53
第3章 单一样本的推断问题 56
3.1符号检验和分位数推断 56
3.1.1基本概念 56
3.1.2大样本计算 60
3.1.3符号检验在配对样本比较中的应用 62
3.1.4分位数检验——符号检验的推广 63
3.2Cox-Staut趋势存在性检验 64
3.3随机游程检验 68
3.4Wilcoxon符号秩检验 71
3.4.1基本概念 71
3.4.2Wilcoxon符号秩检验和抽样分布 74
3.5单组数据的位置参数置信区间估计 80
3.5.1顺序统计量位置参数置信区间估计 80
3.5.2基于方差估计法的位置参数置信区间估计 83
3.6正态记分检验 87
3.7分布的一致性检验 90
3.7.1χ2拟合优度检验 90
3.7.2Kolmogorov-Smirnov正态性检验 94
3.7.3Liliefor正态分布检验 95
3.8单一总体渐近相对效率比较 96
习题 99
第4章 两独立样本数据的位置和尺度推断 102
4.1Brown-Mood中位数检验 103
4.2Wilcoxon-Mann-Whitney秩和检验 105
4.3Mood方差检验 111
4.4Moses方差检验 113
习题 115
第5章 多组数据位置推断 117
5.1试验设计和方差分析的基本概念回顾 117
5.2Kruskal-Wallis单因素方差分析 124
5.3Jonckheere-Terpstra检验 131
5.4Friedman秩方差分析法 135
5.5随机区组数据的调整秩和检验 140
5.6Cochran检验 142
5.7Durbin不完全区组分析法 146
习题 147
第6章 分类数据的关联分析 149
6.1r×s列联表和χ2独立性检验 149
6.2χ2齐性检验 151
6.3Fisher精确性检验 152
6.4Mantel-Haenszel检验 155
6.5关联规则 157
6.5.1关联规则基本概念 157
6.5.2Apriori算法 158
6.6Ridit检验法 160
6.7对数线性模型 166
6.7.1对数线性模型的基本概念 167
6.7.2模型的设计矩阵 172
6.7.3模型的估计和检验 173
6.7.4高维对数线性模型和独立性 174
习题 177
第7章 秩相关和分位数回归 180
7.1Spearman秩相关检验 180
7.2Kendallτ相关检验 184
7.3多变量Kendall协和系数检验 188
7.4Kappa一致性检验 191
7.5中位数回归系数估计法 193
7.5.1Brown-Mood方法 194
7.5.2Theil方法 195
7.5.3关于α和β的检验 196
7.6线性分位回归模型 198
习题 201
第8章 非参数密度估计 203
8.1直方图密度估计 203
8.2核密度估计 207
8.2.1核函数的基本概念 207
8.2.2贝叶斯决策和非参数密度估计 211
8.3k近邻估计 215
习题 216
第9章 一元非参数回归 218
9.1核回归光滑模型 219
9.2局部多项式回归 220
9.2.1局部线性回归 220
9.2.2局部多项式回归的基本原理 222
9.3LOWESS稳健回归 224
9.4k近邻回归 225
9.5正交序列回归 227
9.6罚最小二乘法 229
习题 230
第10章 数据挖掘与机器学习 231
10.1分类一般问题 231
10.2Logistic回归 232
10.2.1Logistic回归模型 233
10.2.2Logistic回归模型的极大似然估计 234
10.2.3Logistic回归和线性判别函数LDA的比较 235
10.3k近邻 237
10.4决策树 238
10.4.1决策树基本概念 238
10.4.2CART 240
10.4.3决策树的剪枝 241
10.4.4回归树 242
10.4.5决策树的特点 242
10.5Boosting 244
10.5.1Boosting方法 244
10.5.2AdaBoost.M1算法 244
10.6支持向量机 247
10.6.1最大边距分类 247
10.6.2支持向量机问题的求解 249
10.6.3支持向量机的核方法 251
10.7随机森林树 253
10.7.1随机森林树算法的定义 253
10.7.2随机森林树算法的性质 253
10.7.3如何确定随机森林树算法中树的节点分裂变量 254
10.7.4随机森林树的回归算法 255
10.7.5有关随机森林树算法的一些评价 255
10.8多元自适应回归样条 256
10.8.1MARS与CART的联系 258
10.8.2MARS的一些性质 258
习题 259
附录 常用统计分布表 262
参考文献 303