第1章 抽样与描述统计 1
1.1 抽样 2
1.1.1 独立性 7
1.1.2 其他抽样方法 8
1.1.3 试验类型 8
1.1.4 数据类型 9
1.2 汇总统计量 11
1.2.1 样本均值 11
1.2.2 标准差 11
1.2.3 异常值 13
1.2.4 样本中位数 14
1.2.5 截尾均值 14
1.2.6 众数与极差 15
1.2.7 四分位数 15
1.2.8 百分位数 16
1.2.9 分类数据的汇总统计量 18
1.2.10 样本统计量与总体参数 18
1.3 统计图 21
1.3.1 茎叶图 21
1.3.2 点图 22
1.3.3 直方图 23
1.3.4 等宽度分类区间 25
1.3.5 直方图以及样本均值和方差 26
1.3.6 对称与倾斜 27
1.3.7 单峰和双峰直方图 27
1.3.8 将高度设定为频数 29
1.3.9 箱图 30
1.3.10 对比箱图 31
1.3.11 多元数据 33
第2章 概率 47
2.1 基本概念 47
2.1.1 合并事件 49
2.1.2 互不相容事件 49
2.1.3 概率 50
2.1.4 概率论的公理化 51
2.1.5 等可能概型 53
2.1.6 加法公式 54
2.2 计数方法 57
2.2.1 排列 58
2.2.2 组合 59
2.3 条件概率和独立性 63
2.3.1 独立事件 66
2.3.2 乘法公式 67
2.3.3 全概率公式 69
2.3.4 贝叶斯公式 71
2.3.5 系统的可靠性分析 73
2.4 随机变量 80
2.4.1 随机变量和总体 83
2.4.2 离散型随机变量 83
2.4.3 离散型随机变量的累积分布函数 84
2.4.4 离散型随机变量的均值和方差 86
2.4.5 概率直方图 88
2.4.6 连续型随机变量 90
2.4.7 利用概率密度函数计算概率 90
2.4.8 连续型随机变量的累积分布函数 92
2.4.9 连续型随机变量的均值和方差 93
2.4.10 总体中位数和总体百分位数 94
2.5 随机变量的线性函数 102
2.5.1 添加一个常数 102
2.5.2 乘以一个常数 103
2.5.3 随机变量线性组合的均值 104
2.5.4 相互独立的随机变量 105
2.5.5 相互独立随机变量线性组合的方差 106
2.5.6 独立的简单随机样本 107
2.5.7 样本均值的期望和方差 107
2.6 随机变量的联合分布 111
2.6.1 联合离散型随机变量 111
2.6.2 联合连续型随机变量 113
2.6.3 多维随机变量 117
2.6.4 随机变量函数的均值 117
2.6.5 条件分布 119
2.6.6 条件期望 121
2.6.7 独立随机变量 122
2.6.8 协方差 124
2.6.9 相关系数 127
2.6.10 协方差、相关系数和独立性 129
2.6.11 随机变量的线性组合 129
2.6.12 样本均值的期望和方差 131
2.6.13 在证券管理中的应用 131
第3章 误差传播 149
3.1 测量误差 149
3.2 测量值的线性组合 154
3.2.1 重复测量 156
3.2.2 具有不同不确定度的重复测量 158
3.2.3 相关测量的线性组合 159
3.3 单测量值函数的不确定度 163
3.3.1 误差传播的不确定度仅是近似值 163
3.3.2 非线性函数是有偏的 164
3.3.3 单测量值函数的相对不确定度 164
3.4 多测量值函数的不确定度 169
3.4.1 相关测量值函数的不确定度 171
3.4.2 多测量值函数的相对不确定度 172
第4章 常用分布 183
4.1 伯努利分布 183
4.2 二项分布 186
4.2.1 服从二项分布的随机变量的分布律函数 187
4.2.2 二项分布随机变量是伯努利随机变量的和 190
4.2.3 二项分布随机变量的均值和方差 190
4.2.4 利用样本比估计成功概率 191
4.2.5 样本比的不确定度 191
4.3 泊松分布 196
4.3.1 泊松分布随机变量的均值和方差 199
4.3.2 利用泊松分布估计速率 202
4.3.3 速率估计量的不确定度 202
4.4 其他离散型分布 209
4.4.1 超几何分布 209
4.4.2 超几何分布的均值和方差 211
4.4.3 与二项分布的比较 211
4.4.4 几何分布 212
4.4.5 几何分布的均值和方差 212
4.4.6 负二项分布 213
4.4.7 负二项分布随机变量是几何分布随机变量的和 214
4.4.8 服从负二项分布的随机变量的均值和方差 214
4.4.9 多项分布 215
4.5 正态分布 219
4.5.1 正态分布的参数估计 225
4.5.2 独立正态分布随机变量的线性组合 225
4.5.3 如何确定数据属于正态总体 226
4.6 对数正态分布 231
4.6.1 对数正态分布的参数估计 233
4.6.2 如何判定数据是否属于对数正态总体 234
4.7 指数分布 237
4.7.1 指数分布和泊松分布 238
4.7.2 指数分布的无记忆性 239
4.8 伽玛分布和韦布尔分布 245
4.8.1 伽玛分布 245
4.8.2 韦布尔分布 247
4.9 概率图 251
4.10 中心极限定理 256
4.10.1 二项分布的正态逼近 259
4.10.2 连续性修正 260
4.10.3 连续性修正的精度 262
4.10.4 正态分布对泊松分布的逼近 262
4.10.5 泊松分布的连续性修正 262
4.11 模拟 266
4.11.1 利用模拟来估计概率 267
4.11.2 均值和方差的估计 270
4.11.3 与误差传播的比较 270
4.11.4 利用模拟确定总体是否近似正态分布 271
4.11.5 模拟在可靠性分析中的应用 272
4.11.6 利用模拟数据估计偏差 274
4.11.7 自助法 275
4.11.8 参数和非参数自助法 276
第5章 置信区间 287
5.1 总体均值的大样本置信区间 288
5.1.1 有关置信水平的补充说明 292
5.1.2 概率与置信水平 293
5.1.3 根据精度要求确定所需样本容量 295
5.1.4 单侧置信区间 295
5.1.5 置信区间必须基于随机样本给出 297
5.2 比例置信区间 301
5.3 总体均值的小样本置信区间 306
5.3.1 学生t分布 306
5.3.2 当样本包含异常值时不要使用学生t分布 309
5.3.3 利用学生t分布建立置信区间 309
5.3.4 如何判断是否采用学生t分布? 310
5.3.5 如果σ已知,则使用z表而不是t曲线 312
5.4 两个均值之差的置信区间 315
5.5 两个比例之差的置信区间 318
5.6 两个均值之差的小样本置信区间 322
5.6.1 总体具有相同方差的情况 325
5.6.2 不能因为样本方差近似相等就假定总体方差相等 326
5.7 数据对的置信区间 329
5.8 用模拟方法建立置信区间 336
5.8.1 利用自助法来建立置信区间 340
5.8.2 用模拟方法来评价置信区间 343
第6章 假设检验 353
6.1 总体均值的大样本检验 353
6.2 从假设检验的结果中推断出结论 361
6.2.1 统计显著性 362
6.2.2 P-值不是H0为真的概率 363
6.2.3 正确选择零假设H0 363
6.2.4 统计显著性与实际的意义不相同 364
6.2.5 假设检验和置信区间的关系 365
6.3 总体比例的检验 369
6.3.1 样本容量必须大 370
6.3.2 与总体比置信区间的关系 372
6.4 总体均值的小样本检验 374
6.5 两个均值差的大样本检验 379
6.6 两个总体比例差的检验 385
6.7 两个均值差的小样本检验 391
6.7.1 两个总体的方差相等的情形 395
6.7.2 不要仅仅因为样本方差近似相等就假设总体方差相等 396
6.8 成对数据的假设检验 399
6.9 任意分布检验 405
6.9.1 Wilcoxon符号秩检验 405
6.9.2 平秩 408
6.9.3 零差值 408
6.9.4 大样本逼近 409
6.9.5 Wilcoxon秩和检验 410
6.9.6 大样本逼近 411
6.9.7 任意分布方法的假设条件 412
6.10 卡方检验 415
6.10.1 齐性的卡方检验 418
6.10.2 独立性的卡方检验 420
6.11 方差相等的F检验 426
6.11.1 F分布 426
6.11.2 关于方差相等检验的F统计量 427
6.11.3 F检验对非正态总体敏感 429
6.11.4 F检验不能证明两个方差相等 429
6.12 固定显著性水平的假设检验 430
6.12.1 临界点和拒绝域 430
6.12.2 第Ⅰ类错误和第Ⅱ类错误 432
6.13 功效 435
6.14 多重检验 444
6.15 利用随机模拟进行假设检验 448
6.15.1 利用自助置信区间检验假设 449
6.15.2 随机化检验 449
6.15.3 利用模拟估计功效 452
第7章 相关性与简单线性回归 463
7.1 相关性 463
7.1.1 相关系数的含义 467
7.1.2 相关系数是一个数 468
7.1.3 相关系数只能度量线性关系 469
7.1.4 异常值 469
7.1.5 相关性不是因果关系 470
7.1.6 对总体相关系数的推断 473
7.2 最小二乘直线 479
7.2.1 求解最小二乘直线方程 481
7.2.2 计算公式 482
7.2.3 估计值与真实值的差别 484
7.2.4 残差与误差的区别 484
7.2.5 不能在数据范围外推断 484
7.2.6 对非线性数据不能采用最小二乘直线 485
7.2.7 最小二乘直线的另一种含义 485
7.2.8 度量拟合优度 486
7.3 最小二乘系数的不确定度 495
7.3.1 x值的散布程度越大越好(某种意义下) 497
7.3.2 斜率和截距的推导 498
7.3.3 平均响应的推导 501
7.3.4 观测值的预测区间 504
7.3.5 解释计算机输出 506
7.4 假设条件的验证与数据变换 512
7.4.1 残差与拟合值的关系图 512
7.4.2 变量变换 515
7.4.3 确定采用何种变换 516
7.4.4 变换并不总是适用 517
7.4.5 很难解释点数较少的残差图 517
7.4.6 异常值与影响点 520
7.4.7 除了变量变换以外的其他方法 521
7.4.8 检测独立性和正态性 522
7.4.9 经验模型与物理定律 523
第8章 多重回归 541
8.1 多重回归模型 541
8.1.1 系数的估计 542
8.1.2 平方和 542
8.1.3 统计量s2、R2和F 544
8.1.4 示例 545
8.1.5 多重回归模型中假设条件的验证 548
8.2 混杂与共线性 558
8.3 模型选择 567
8.3.1 确定模型中需要去除的变量 569
8.3.2 最小子集回归 574
8.3.3 逐步回归 576
8.3.4 模型选择程序有时会找出一些无意义的模型 578
第9章 析因试验 609
9.1 单因素试验 609
9.1.1 完全随机试验 610
9.1.2 单因素方差分析 611
9.1.3 处理均值的置信区间 616
9.1.4 方差分析表 616
9.1.5 验证假设条件 618
9.1.6 平衡和非平衡设计 619
9.1.7 方差分解恒等式 620
9.1.8 另一种参数化方法 620
9.1.9 功效 621
9.1.10 随机效应模型 623
9.2 单因素试验中的配对比较 630
9.2.1 Fisher的最小显著性 差异方法 631
9.2.2 多重比较的Bonferroni方法 634
9.2.3 多重比较的Tukey-Kramer方法 635
9.3 双因素试验 642
9.3.1 双因素方差分析 643
9.3.2 使用双因素方差分析方法进行假设检验 647
9.3.3 假设条件的验证 651
9.3.4 加性模型不成立时,不能用主效应解释 652
9.3.5 双因素方差分析与两个单因素方差分析的区别 654
9.3.6 交互作用图 655
9.3.7 双因素方差分析中的多重比较 656
9.3.8 K=1时的双因素方差分析 658
9.3.9 随机因素 658
9.3.10 不平衡设计 658
9.4 随机化完全区组设计 665
9.5 2p析因试验 674
9.5.1 23析因试验中的记号 674
9.5.2 23析因试验中的效应估计 674
9.5.3 解释计算机的输出 678
9.5.4 2p析因试验的效应估计 680
9.5.5 无重复析因试验 681
9.5.6 运用概率图检测重要效应 684
9.5.7 分式析因试验 684
第10章 统计质量控制 705
10.1 基本思想 705
10.1.1 收集数据——合理子组 706
10.1.2 控制与能力 706
10.1.3 过程控制必须连续进行 707
10.2 变量控制图 708
10.2.1 控制图的性能 714
10.2.2 美国西部电气公司规则 717
10.2.3 S图 718
10.2.4 比较S图和R图 722
10.2.5 样本容量为1的样本 722
10.3 属性控制图 728
10.3.1 p图 728
10.3.2 属性控制图中处于控制界限外的信号的解释 730
10.3.3 C图 730
10.4 累积和图 733
10.5 过程能力 737
10.5.1 根据过程能力估计不符合规格要求的个体比例 740
10.5.2 六西格码质量 740
10.5.3 单侧容限 741
附录A 表格 745
附录B 偏导数 777
附录C 部分习题解答 779