第1章 为什么要学习统计学 1
1.1 不确定环境下的决策 2
1.2 抽样 3
1.3 描述统计学和推断统计学 4
1.3.1 描述数据 5
1.3.2 做出推论 5
第2章 描述数据:图形 9
2.1 变量的类型 10
2.1.1 分类变量和数值型变量 10
2.1.2 测量水平 11
2.2 描述分类变量的图表 13
2.2.1 表 13
2.2.2 条形图和饼图 14
2.2.3 帕累托图 16
2.3 描述时间序列数据的图表 20
2.4 描述数值型变量的图表 23
2.4.1 频数分布 23
2.4.2 直方图和拱形图 27
2.4.3 茎叶图 29
2.5 描述变量关系的图表 31
2.5.1 散点图 32
2.5.2 交叉表 33
2.6 数据表述错误 38
2.6.1 错误的直方图 38
2.6.2 错误的时间序列图 40
第3章 描述数据:数值 46
3.1 集中趋势的测量 46
3.1.1 均值、中位数、众数 46
3.1.2 分布的形状 49
3.2 离散趋势的测量 51
3.2.1 极差和内距 52
3.2.2 方差和标准差 53
3.2.3 切比雪夫定理和经验法则 55
3.2.4 离散系数 57
3.3 加权平均数和分组数据的测量值 60
3.4 变量之间关系的测量值 65
3.5 线性关系的获取 70
第4章 概率 78
4.1 随机试验、结果、事件 79
4.2 概率及其基本原理 87
4.2.1 古典概率 88
4.2.2 相对频数 90
4.2.3 主观概率 91
4.3 概率法则 96
4.3.1 条件概率 99
4.3.2 统计独立性 102
4.4 二元概率 109
4.4.1 胜算比 113
4.4.2 过度包含比率 114
4.5 贝叶斯定理 120
第5章 离散型随机变量及其概率分布 134
5.1 随机变量 135
5.2 离散型随机变量的概率分布 137
5.3 离散型随机变量的性质 140
5.3.1 离散型随机变量的期望值 140
5.3.2 离散型随机变量的方差 142
5.3.3 随机变量线性函数的均值和方差 145
5.4 二项分布 150
5.5 超几何分布 158
5.6 泊松概率分布 160
5.6.1 用泊松分布近似求解二项分布 163
5.6.2 泊松概率分布与二项概率分布的比较 164
5.7 联合分布的离散型随机变量 166
5.7.1 计算机应用 170
5.7.2 协方差 170
5.7.3 相关系数 171
5.7.4 随机变量的线性函数 174
5.7.5 投资组合分析 176
第6章 连续型随机变量及其概率分布 187
6.1 连续型随机变量 188
均匀分布 191
6.2 连续型随机变量的期望值 194
6.3 正态分布 197
正态概率图 205
6.4 用正态分布近似二项分布 210
比例随机变量 214
6.5 指数分布 216
6.6 连续型随机变量的联合分布 219
随机变量的线性组合 222
第7章 抽样和抽样分布 232
7.1 从总体中抽样 233
7.2 样本均值的抽样分布 238
7.2.1 中心极限定理 243
7.2.2 可接受区间 248
7.3 样本比例的抽样分布 254
7.4 样本方差的抽样分布 260
第8章 估计:单个总体的估计 275
8.1 点估计量的性质 276
8.1.1 无偏估计量 277
8.1.2 一致估计量 278
8.1.3 有效估计量 279
8.2 均值的置信区间:总体方差已知 282
8.2.1 基于正态分布的置信区间 284
8.2.2 缩小错误边际 287
8.3 均值的置信区间:总体方差未知 289
8.3.1 学生t分布 289
8.3.2 基于学生t分布的置信区间 291
8.4 总体比例的置信区间(大样本) 295
第9章 参数估计的进一步讨论 303
9.1 两个正态总体均值差异的置信区间 304
9.1.1 非独立样本 304
9.1.2 独立样本,总体方差已知 306
9.2 两个正态分布总体均值差异的置信区间:总体方差未知 309
9.2.1 独立样本,假设总体方差相等 309
9.2.2 虫立样本,假设总体方差不相等 312
9.3 两个总体比例差异的置信区间(大样本) 315
9.4 正态分布总体方差的置信区间 317
9.5 样本容量的确定 321
9.5.1 正态分布总体的均值:总体方差已知 321
9.5.2 总体比例 323
第10章 假设检验 330
10.1 假设检验的概念 331
10.2 正态分布均值的检验:总体方差已知 337
10.2.1 p值 339
10.2.2 双侧备择假设 345
10.3 正态分布均值的检验:总体方差未知 348
10.4 总体比例的检验(大样本) 352
10.5 评价检验的有效性 355
10.5.1 正态分布均值的检验:总体方差已知 356
10.5.2 总体比例检验的有效性(大样本) 358
第11章 假设检验Ⅱ 367
11.1 两个总体均值差异的检验 369
11.1.1 配对的均值 369
11.1.2 两个均值,独立样本,总体方差已知 372
11.1.3 两个均值,独立总体,方差未知且假设相等 375
11.1.4 两个均值,独立样本,总体方差未知且假设不相等 378
11.2 两总体比例差异的检验(大样本) 381
11.3 一个正态分布方差的检验 385
11.4 两个正态分布总体方差相等的检验 389
11.5 假设检验的评论 393
第12章 简单线性回归 402
12.1 相关性分析 403
相关性的假设检验 404
12.2 线性回归模型 407
12.3 用最小二乘法求系数估计值 413
回归系数的计算机计算 416
12.4 线性回归方程解释的有效性 418
判定系数R2 421
12.5 统计推断:假设检验和置信区间 426
总体斜率系数的F分布假设检验 433
12.6 预测 435
12.7 图形分析 441
第13章 多元回归 454
13.1 多元回归模型 455
13.1.1 模型设定 456
13.1.2 模型建立 458
13.1.3 三维图 461
13.2 系数的估计 463
最小二乘法 464
13.3 多元回归方程解释的有效性 470
13.4 单个回归系数的置信区间和假设检验 477
13.4.1 置信区间 479
13.4.2 假设检验 481
13.5 回归系数的检验 490
13.5.1 所有系数的检验 491
13.5.2 回归系数子集的检验 493
13.5.3 F和t检验的比较 494
13.6 预测 498
13.7 非线性模型的转化 500
13.7.1 二次方程的转化 501
13.7.2 对数的转化 504
13.8 回归模型的虚拟变量 509
斜率的差别 513
13.9 多元回归分析的应用方法 517
13.9.1 模型设定 518
13.9.2 多元回归 520
13.9.3 剔除某统计显著变量的影响 522
13.9.4 残差分析 523
第14章 回归分析的进一步讨论 538
14.1 建立模型的方法论 539
14.1.1 模型设定 539
14.1.2 系数估计 540
14.1.3 模型确定 541
14.1.4 模型解释和推断 542
14.2 虚拟变量和试验设计 542
试验设计模型 546
14.3 因变量的滞后值作为回归量 553
14.4 设定的偏差 557
14.5 多重共线性 561
14.6 异方差性 564
14.7 误差的自相关 569
14.7.1 误差自相关回归的估计 573
14.7.2 包含滞后因变量模型的误差自相关 577
第15章 非参数估计 586
15.1 符号检验和置信区间 587
15.1.1 成对或配对样本的符号 587
15.1.2 正态近似 590
15.1.3 单个总体中位数的符号检验 592
15.1.4 中位数的置信区间 593
15.2 威尔科克森符号秩检验 595
15.2.1 Minitab(威尔科克森符号秩检验) 596
15.2.2 正态近似 597
15.3 曼-惠特尼U检验 600
15.4 威尔科克森秩和检验 604
15.5 斯皮尔曼秩相关系数检验 607
第16章 拟合优度检验和列联表 612
16.1 确定概率的拟合优度检验 613
16.2 总体参数未知的拟合优度检验 617
正态性检验 619
16.3 列联表 622
计算机应用 626
第17章 方差分析 634
17.1 几个总体均值的比较 635
17.2 单因素方差分析 637
单因素方差分析的总体模型 644
17.3 克鲁斯卡尔-沃利斯检验 647
17.4 双因素方差分析:每个单元格包含一个观测值,随机分组 650
17.5 双因素方差分析:每个单元格包含多个观测值 661
第18章 质量简介 677
18.1 质量的重要性 678
18.1.1 质量领导者 678
18.1.2 变异性 680
18.2 均值和标准差的控制图 682
18.2.1 过程标准差的估计 683
18.2.2 均值的控制图 686
18.2.3 标准差的控制图 688
18.2.4 控制图的解释 689
18.3 生产过程的生产能力 693
18.4 比例的控制图 697
18.5 发生次数的控制图 701
第19章 时间序列分析与预测 710
19.1 指数 712
19.1.1 单个商品价格指数 713
19.1.2 非加权综合价格指数 714
19.1.3 加权综合价格指数 715
19.1.4 加权综合指数 717
19.1.5 基期的变化 718
19.2 随机性的非参数检验 721
19.3 时间序列成分 724
19.4 移动平均 727
通过移动平均分离季节性成分 729
19.5 指数平滑 736
19.5.1 霍尔特-温特斯指数平滑预测模型 738
19.5.2 预测季节性时间序列 743
19.6 自回归模型 747
19.7 综合自回归移动平均模型 752
第20章 抽样的进一步讨论 756
20.1 抽样研究的基本步骤 757
20.1.1 需要什么样的信息 758
20.1.2 总体是什么,是否可以列个清单 758
20.1.3 如何选取样本成员 759
20.1.4 如何从样本成员中获得信息 759
20.1.5 如何利用样本信息对总体进行推断 761
20.1.6 从总体中可以得出哪些结论 761
20.2 抽样和非抽样误差 762
20.3 简单随机抽样 763
简单随机抽样结果的分析 764
20.4 分层抽样 769
20.4.1 分层随机抽样结果的分析 771
20.4.2 在层之间分配抽样工作 777
20.5 确定样本容量 781
20.5.1 简单随机抽样的样本容量:总体均值或总量的估计 782
20.5.2 简单随机抽样的样本容量:总体比例的估计 783
20.5.3 确定精确度分层随机抽样的样本容量 784
20.6 其他抽样方法 787
20.6.1 整群抽样 787
20.6.2 两阶段抽样 791
20.6.3 非概率抽样方法 793
第21章 统计决策理论 798
21.1 不确定性条件下的决策 799
21.2 不包含确定概率的解决方案:最大最小准则、最小最大遗憾准则 802
21.2.1 最大最小准则 803
21.2.2 最小最大遗憾准则 805
21.3 期望货币价值、TreePlan软件 807
21.3.1 决策树 809
21.3.2 用TreePlan软件解一个决策树 811
21.3.3 敏感性分析 814
21.4 样本信息:贝叶斯分析与评价 818
21.4.1 贝叶斯定理的应用 818
21.4.2 样本信息的价值 823
21.4.3 用决策树计算的样本信息的价值 826
21.5 考虑风险:效用分析 831
21.5.1 效用的概念 832
21.5.2 决策的期望效用准则 836
附录A 表格 841
表A-1 标准正态分布的累积概率函数 841
表A-2 二项分布的概率函数 843
表A-3 累积二项概率 848
表A-4 e-λ的值 852
表A-5 单个泊松概率 853
表A-6 累积泊松概率 861
表A-7 卡方分布函数的临界点 869
表A-8 学生t分布的临界点 870
表A-9 F分布的临界点 871
表A-10 威尔科克森检验统计量的临界点 874
表A-11 斯皮尔曼秩相关系数的临界点 875
表A-12 德宾-沃森检验统计量的临界点 876
表A-13 控制图的因子 878
表A-14 游程检验统计量的累积分布函数 879
附录B 偶数题答案 881