1 概率论复习与补充 1
1.1 概率空间 1
1.1.1 基本空间与事件域 1
1.1.2 概率的定义与性质 1
1.1.3 条件概率与事件的独立性 2
1.2 随机变量及其分布 3
1.2.1 一维随机变量的分布 3
1.2.2 多维随机变量及其分布 5
1.3 随机变量的函数及其分布 9
1.3.1 一维随机变量的函数及其分布 9
1.3.2 二维随机变量的函数及其分布 11
1.3.3 二维随机变量的变换及其分布 12
1.3.4 随机变量函数的独立性 14
1.4 随机变量的数字特征 15
1.4.1 数学期望(均值) 15
1.4.2 方差 16
1.4.3 一些常用分布的期望与方差 17
1.4.4 矩、协方差与相关系数 18
1.4.5 条件数学期望 20
1.5 大数定律与中心极限定理 20
1.5.1 随机变量序列的收敛性 20
1.5.2 大数定律 22
1.5.3 中心极限定理 23
1.6 特征函数 25
1.6.1 复随机变量 25
1.6.2 特征函数的定义 25
1.6.3 特征函数的一些常用性质 27
习题1 31
2 数理统计的基本概念与抽样分布 33
2.1 数理统计的几个基本概念 33
2.1.1 总体与样本 33
2.1.2 统计量 35
2.2 经验分布函数与直方图 36
2.2.1 经验分布函数 36
2.2.2 直方图 38
2.3 常用统计分布 41
2.3.1 x2分布 41
2.3.2 t分布 45
2.3.3 F分布 47
2.3.4 分位数 48
2.4 抽样分布 50
2.4.1 正态总体的样本均值与方差的分布 50
2.4.2 一些非正态总体的样本均值的分布 56
2.5 顺序统计量与样本极差 58
2.5.1 顺序统计量及其分布 58
2.5.2 样本极差及其分布 61
习题2 62
3 参数估计 65
3.1 求点估计量的方法 65
3.1.1 矩法 65
3.1.2 最大似然法 69
3.1.3 顺序统计量法 73
3.2 估计量的评选标准 76
3.2.1 无偏性 76
3.2.2 有效性 79
3.2.3 相合性 84
3.2.4 充分性与完备性 89
3.3 Bayes点估计法 95
3.3.1 Bayes公式的密度函数形式 95
3.3.2 Bayes估计 96
3.3.3 损失函数、Bayes风险与Bayes估计 98
3.4 区间估计 102
3.4.1 正态总体均值的区间估计 103
3.4.2 正态总体方差的区间估计 106
3.4.3 两个正态总体均值差的区间估计 107
3.4.4 两个正态总体方差比的区间估计 110
3.4.5 正态总体的μ与σ2的联合区间估计 113
3.4.6 0-1分布的参数的区间估计 114
3.4.7 单侧置信限 116
习题3 118
4 假设检验 122
4.1 假设检验的基本概念 122
4.1.1 假设检验问题 122
4.1.2 假设检验的基本原理 123
4.1.3 两类错误 125
4.1.4 假设检验的一般步骤 128
4.2 一个正态总体均值与方差的检验 129
4.2.1 方差σ2为已知时均值μ的假设检验 129
4.2.2 方差σ2为未知时均值μ的假设检验 131
4.2.3 均值μ为已知时方差σ2的假设检验 133
4.2.4 均值μ为未知时方差σ2的假设检验 134
4.3 两个正态总体均值与方差的检验 137
4.3.1 方差已知时均值差μ1-μ2的假设检验 137
4.3.2 方差未知但相等时μ1-μ2的假设检验 139
4.3.3 μ1,μ2为未知时方差的假设检验 141
4.3.4 μ1,μ2为已知时方差的假设检验 143
4.4 非正态总体均值的假设检验 145
4.4.1 方差已知时一个总体的均值的假设检验 145
4.4.2 方差未知时一个总体的均值的假设检验 146
4.4.3 方差已知时两个总体的均值差的假设检验 148
4.4.4 方差未知时两个总体的均值差的假设检验 148
4.5 分布拟合检验 150
4.5.1 x2拟合检验法 150
4.5.2 独立性检验 156
4.5.3 Колмогоров(柯尔莫戈洛夫)的Dn检验法 159
4.5.4 正态性检验 163
4.6 两个总体相等性检验 170
4.6.1 смирнов(斯米尔诺夫)检验法 170
4.6.2 符号检验法 172
4.6.3 秩和检验法 174
4.6.4 游程检验法 177
习题4 179
5 回归分析 186
5.1 一元线性回归 186
5.1.1 一元线性回归模型 186
5.1.2 未知参数的估计 188
5.1.3 线性回归效果的显著性检验 195
5.1.4 利用回归方程进行预测和控制 200
5.2 多元线性回归 206
5.2.1 多元线性回归模型 206
5.2.2 二元线性回归 207
5.2.3 多元线性回归方程 208
5.2.4 线性回归效果的显著性检验 213
5.2.5 各自变量的显著性检验,剔除变量计算 216
5.2.6 预测与控制 218
5.2.7 最优回归方程的选择 220
5.3 非线性回归 221
5.3.1 第一类非线性回归 222
5.3.2 第二类非线性回归 225
习题5 228
6 方差分析与试验设计 232
6.1 一个因素的方差分析 232
6.1.1 数学模型 232
6.1.2 统计分析 234
6.2 两个因素的方差分析 246
6.2.1 数学模型 247
6.2.2 统计分析 248
6.2.3 不考虑交互作用的两个因素方差分析 256
6.3 正交试验设计的直观分析 260
6.3.1 正交表 261
6.3.2 单指标的正交试验及其结果的直观分析 262
6.3.3 正交试验设计原理的解释 267
6.3.4 多指标试验结果的直观分析 268
6.3.5 有交互作用的正交试验及其结果的直观分析 273
6.4 正交试验设计的方差分析 277
6.4.1 无交互作用的正交试验的方差分析 277
6.4.2 有交互作用的正交试验的方差分析 285
6.4.3 带重复试验的方差分析 298
6.5 水平数不等的正交试验 304
6.5.1 混合水平的正交表及其用法 304
6.5.2 拟水平法 307
6.6 均匀设计 311
6.6.1 均匀设计表 312
6.6.2 均匀设计表的构造 314
6.6.3 配方均匀设计 319
习题6 321
7 数据挖掘及统计学习方法 329
7.1 数据挖掘的一般概念 329
7.1.1 数据挖掘的概念及知识分类 329
7.1.2 数据挖掘的功能与步骤 330
7.1.3 数据挖掘的分类 331
7.2 统计学习方法概述 332
7.2.1 学习种类与变量类型 332
7.2.2 两种简单预测方法 332
7.2.3 统计判决理论 334
7.2.4 偏倚、方差和模型复杂性 336
7.3 回归的线性方法 338
7.3.1 线性回归模型 338
7.3.2 子集选择和系数收缩 341
7.4 分类的线性方法 343
7.4.1 指示矩阵的线性回归 344
7.4.2 线性判别分析 344
7.4.3 劳吉斯缔回归 346
习题答案 350
附录A 常用数理统计表 357
表1 标准正态分布表 357
表2 正态分布常用分位数表 361
表3 t分布分位数表 361
表4 x2分布分位数表 362
表5 F分布分位数表 365
表6 柯尔莫戈洛夫分布的分位数表P{Dn≤Dn,p}=P 374
表7 夏皮罗-威尔克检验,计算统计量W所必需的系数αk(W) 375
表8 夏皮罗-威尔克检验,统计量W的概率α=0.01和0.05的分位数 377
表9 符号检验表P(S≤Sα)=α 378
表10 秩和检验表P(T1<T<T2)=1-α 378
表11 游程总数检验表 379
表12 游程最大长度检验临界值Lα表(P{L≥Lα}≤α) 381
表13 相关系数临界值ra表P(|r|>rα)=α 382
表14 正交表 382
表15 等水平均匀设计表 387
表16 混合均匀设计表 393
附录B R软件简介 399
B.1 基本操作 400
B.2 数据类型与对象 401
B.3 向量及运算 403
B.4 矩阵的生成及运算 405
B.5 统计计算有关的常用函数 409
B.6 因子 411
B.7 列表 412
B.8 数据框 413
B.9 数据读写 414
B.10 简单编程 416
B.11 作图 419
参考文献 425