第1章 导论 1
统计应用:质量管理中的6σ 1
1.1 统计及其应用领域 2
1.1.1 什么是统计学 2
1.1.2 统计的应用领域 3
1.1.3 历史上著名的统计学家 6
1.2 统计数据的类型 7
1.2.1 分类数据、顺序数据、数值型数据 7
1.2.2 观测数据和实验数据 8
1.2.3 截面数据和时间序列数据 8
1.3 统计中的几个基本概念 9
1.3.1 总体和样本 9
1.3.2 参数和统计量 11
1.3.3 变量 12
思考与练习 13
人物传记——Adolphe Quetelet 15
第2章 数据收集 17
统计应用:北京市2005年1%人口抽样调查 17
2.1 数据来源 19
2.1.1 数据的间接来源 19
2.1.2 数据的直接来源 19
2.2 调查设计 25
2.2.1 调查方案的结构 25
2.2.2 调查问卷设计 26
2.3 数据质量 36
2.3.1 数据的误差 36
2.3.2 数据的质量要求 36
思考与练习 37
人物传记——William G.Cochran 37
第3章 数据的图表展示 39
统计应用:把数据画图之后要用用脑袋! 39
3.1.2 数据筛选 40
3.1 数据的预处理 40
3.1.1 数据审核 40
3.1.3 数据排序 43
3.1.4 数据透视表 44
3.2 品质数据的整理与展示 48
3.2.1 分类数据的整理与图示 48
3.2.2 顺序数据的整理与图示 55
3.3 数值型数据的整理与展示 57
3.3.1 数据分组 57
3.3.2 数值型数据的图示 62
3.4 合理使用图表 75
3.4.1 鉴别图形优劣的准则 76
3.4.2 统计表的设计 76
思考与练习 79
人物传记——John W.Tukey 86
统计应用:一种测量的平均数比单个的测量更可靠 87
第4章 数据的概括性度量 87
4.1 集中趋势的度量 88
4.1.1 分类数据:众数 88
4.1.2 顺序数据:中位数和分位数 89
4.1.3 数值型数据:平均数 93
4.1.4 众数、中位数和平均数的比较 98
4.2 离散程度的度量 99
4.2.1 分类数据:异众比率 100
4.2.2 顺序数据:四分位差 100
4.2.3 数值型数据:方差和标准差 101
4.2.4 相对离散程度:离散系数 107
4.3 偏态与峰态的度量 109
4.3.1 偏态及其测度 109
4.3.2 峰态及其测度 110
思考与练习 113
人物传记——Pafnuty Lvovich Chebyshev 118
统计应用:买彩不是“押宝” 120
第5章 概率与概率分布 120
5.1 事件及其概率 122
5.1.1 试验、事件和样本空间 122
5.1.2 事件的概率 124
5.1.3 概率的性质和运算法则 125
5.1.4 条件概率与事件的独立性 130
5.1.5 全概率公式与逆概率公式 134
5.2 离散型概率分布 137
5.2.1 随机变量 137
5.2.2 离散型随机变量的概率分布 138
5.2.3 离散型随机变量的数学期望和方差 140
5.2.4 几种常用的离散型概率分布 141
5.3 连续型概率分布 151
5.3.1 概率密度函数 151
5.3.2 正态分布 152
5.3.3 其他连续型概率分布 166
思考与练习 170
人物传记——James Bernoulli Carl Friedrich Gauss 173
第6章 抽样与抽样分布 176
统计应用:“抓阄”征兵计划 176
6.1 概率抽样方法 177
6.1.1 简单随机抽样 177
6.1.2 分层抽样 179
6.1.3 系统抽样 180
6.1.4 整群抽样 180
6.2.1 总体分布 181
6.2 3种不同性质的分布 181
6.2.2 样本分布 182
6.2.3 抽样分布 182
6.3 一个总体参数推断时样本统计量的抽样分布 183
6.3.1 样本均值的抽样分布 183
6.3.2 样本比例的抽样分布 189
6.3.3 样本方差的抽样分布 190
6.4.1 两个样本均值之差的抽样分布 194
6.4 两个总体参数推断时样本统计量的抽样分布 194
6.4.3 两个样本方差比的抽样分布 195
6.4.2 两个样本比例之差的抽样分布 195
思考与练习 198
人物传记——William Sealy Gosset 201
第7章 参数估计 203
统计应用:一次失败的民意调查 203
7.1 参数估计的一般问题 204
7.1.1 估计量与估计值 204
7.1.2 点估计与区间估计 205
7.1.3 评价估计量的标准 209
7.2 一个总体参数的区间估计 211
7.2.1 总体均值的区间估计 211
7.2.2 总体比例的区间估计 217
7.2.3 总体方差的区间估计 219
7.2.4 正态总体未来观测值的预测区间估计 220
7.3.1 两个总体均值之差的区间估计 222
7.3 两个总体参数的区间估计 222
7.3.2 两个总体比例之差的区间估计 228
7.3.3 两个总方差比的区间估计 229
7.4 样本容量的确定 234
7.4.1 估计总体均值时样本容量的确定 234
7.4.2 估计总体比例时样本容量的确定 235
7.4.3 估计两个总体均值之差时样本容量的确定 236
7.4.4 估计两个总体比例之差时样本容量的确定 237
思考与练习 237
人物传记——Jerzy Neyman 244
第8章 假设检验 246
统计应用:药物筛选中的假设检验 246
8.1 假设检验的基本问题 248
8.1.1 假设的陈述 248
8.1.2 两类错误与显著性水平 252
8.1.3 检验统计量与拒绝域 255
8.1.4 利用P值进行决策 257
8.1.5 统计显著性与实际显著性 261
8.2 一个总体参数的检验 264
8.2.1 总体均值的检验 264
8.2.2 总体比例的检验 272
8.2.3 总体方差的检验 275
8.3 两个总体参数的检验 278
8.3.1 两个总体均值之差的检验 278
8.3.2 两个总体比例之差的检验 290
8.3.3 两个总体方差比的检验 293
思考与练习 297
人物传记——Egon Sharpe Pearson 304
第9章 方差分析与试验设计 306
统计应用:SARS病毒灭活疫苗临床试验 306
9.1 方差分析引论 308
9.1.1 方差分析及其有关术语 308
9.1.2 方差分析的基本思想和原理 310
9.1.3 方差分析中的基本假定 313
9.1.4 问题的一般提法 315
9.2 单因素方差分析 316
9.2.1 数据结构 316
9.2.2 分析步骤 317
9.2.3 关系强度的测量 324
9.2.4 方差分析中的多重比较 325
9.3 双因素方差分析 327
9.3.1 双因素方差分析及其类型 327
9.3.2 无交互作用的双因素方差分析 328
9.3.3 有交互作用的双因素方差分析 334
9.4 试验设计初步 338
9.4.1 完全随机化设计 338
9.4.2 随机化区组设计 339
9.4.3 因子设计 341
思考与练习 342
人物传记——Ronald Aylmer Fisher 348
统计应用:回归分析在投资风险中的应用 351
第10章 一元线性回归 351
10.1 变量间关系的度量 353
10.1.1 变量间的关系 353
10.1.2 相关关系的描述与测度 354
10.1.3 相关关系的显著性检验 359
10.2 一元线性回归 361
10.2.1 一元线性回归模型 362
10.2.2 参数的最小二乘估计 365
10.2.3 回归直线的拟合优度 370
10.2.4 显著性检验 374
10.2.5 回归分析结果的评价 378
10.3 利用回归方程进行估计和预测 379
10.3.1 点估计 379
10.3.2 区间估计 380
10.4.1 用残差证实模型的假定 384
10.4 残差分析 384
10.4.2 用残差检测异常值和有影响的观测值 388
思考与练习 390
人物传记——Francis Galton 397
第11章 多元线性回归 400
统计应用:预测大学足球比赛的获胜得分差额 400
11.1 多元线性回归模型 401
11.1.1 多元回归模型与回归方程 402
11.1.2 估计的多元回归方程 403
11.1.3 参数的最小二乘估计 403
11.2 回归方程的拟合优度 406
11.2.1 多重判定系数 406
11.2.2 估计标准误差 407
11.3 显著性检验 408
11.3.1 线性关系检验 408
11.3.2 回归系数检验和推断 409
11.4.1 多重共线性及其所产生的问题 411
11.4 多重共线性 411
11.4.2 多重共线性的判别 412
11.4.3 多重共线性问题的处理 413
11.5 利用回归方程进行估计和预测 415
11.6 变量选择与逐步回归 416
11.6.1 变量选择过程 416
11.6.2 向前选择 417
11.6.3 向后剔除 418
11.6.4 逐步回归 418
11.7 虚拟自变量的回归 420
11.7.1 含有一个虚拟自变量的回归 420
11.7.2 用虚拟自变量回归解决方差分析问题 426
11.8 非线性回归 429
11.8.2 幂函数曲线 430
11.8.3 对数曲线 430
11.8.1 双曲线 430
思考与练习 433
人物传记——George Waddell Snedecor 440
第12章 时间序列分析和预测 441
统计应用:平均增长率的计算争议 441
12.1 时间序列及其分解 443
12.2 时间序列的描述性分析 446
12.2.1 图形描述 446
12.2.2 增长率分析 447
12.3 时间序列预测的程序 451
12.3.1 确定时间序列的成分 451
12.3.2 选择预测方法 454
12.3.3 预测方法的评估 455
12.4 平稳序列的预测 457
12.4.1 简单平均法 457
12.4.2 移动平均法 458
12.4.3 指数平滑法 460
12.5.1 线性趋势预测 463
12.5 趋势型序列的预测 463
12.5.2 非线性趋势预测 465
12.6 季节型序列的预测 475
12.7 复合型序列的分解预测 479
12.7.1 确定并分离季节成分 479
12.7.2 建立预测模型并进行预测 483
12.7.3 计算最后的预测值 484
12.8 周期性分析 485
思考与练习 487
人物传记——Abraham Wald 494
第13章 指数 496
统计应用:报道价格指数 496
13.1 引言 497
13.2 加权指数 498
13.2.1 加权综合指数 498
13.2.2 加权平均指数 500
13.2.3 价值指数与指数体系 502
13.3 几种常用的价格指数 503
13.3.1 零售价格指数 503
13.3.2 消费者价格指数 504
13.3.3 生产价格指数 506
13.3.4 股票价格指数 507
13.4 多指标综合评价指数 508
13.4.1 多指标综合评价指数的构建 508
13.4.2 几种常用的综合评价指数 510
思考与练习 513
人物传记——Karl Pearson 515
附录1 各章练习题答案 518
附录2 常用统计表 543
表1 标准正态曲线下的面积 543
表2 t统计量的临界值 545
表3 x2统计量的临界值 546
表4 F统计量的临界值 548
参考文献 556