第1章 统计学概述 1
案例导入:有关文学著作的统计推断 1
1.1 统计学及相关概念 2
1.1.1 什么是统计学 2
1.1.2 统计学中的一些基本概念 3
1.2 统计数据的搜集 4
1.2.1 统计数据的来源 4
1.2.2 统计调查 5
1.2.3 统计实验 7
1.2.4 统计数据的误差 8
1.3 常用统计软件介绍 9
1.4 R语言基本操作简介 11
1.4.1 R语言基本知识概述 11
1.4.2 R语言中的向量与矩阵 18
1.4.3 列表、数据框与因子 26
1.4.4 R语言程序设计 29
1.4.5 编写函数 31
第2章 统计数据的整理与显示 33
案例导入:如何整理和显示数据 33
2.1 统计数据的整理 34
2.1.1 统计数据的预处理 34
2.1.2 统计分组 38
2.1.3 次数分布数列 43
2.1.4 累计次数分布 51
2.2 统计表 54
2.2.1 统计表的定义和结构 54
2.2.2 统计表的分类 55
2.2.3 编制统计表应注意的问题 57
2.3 统计图 57
2.3.1 反映数据分布的图示 58
2.3.2 反映现象依存关系的图形 68
2.3.3 反映现象变化趋势的图形 71
2.3.4 R语言绘图基本知识补充 71
2.4 案例分析——灯泡使用寿命数据的整理与显示 76
第3章 统计数据的描述性分析 78
案例导入:今天,你被平均了吗 78
3.1 集中趋势的描述 79
3.1.1 数值平均数 79
3.1.2 位置平均数 81
3.1.3 算术平均数、众数和中位数的关系 82
3.2 离散程度的描述 83
3.2.1 极差与四分位差 83
3.2.2 平均差 84
3.2.3 方差和标准差 85
3.2.4 离散系数 86
3.3 数据分布形状的描述 86
3.3.1 分布偏态的描述 86
3.3.2 分布峰态的描述 87
3.4 应用Excel计算描述性统计指标 88
3.4.1 利用统计函数计算描述统计量 88
3.4.2 用【数据分析】工具计算描述统计量 91
3.5 应用R语言计算描述性统计指标 92
3.5.1 算术平均数的计算 92
3.5.2 调和平均数的计算 93
3.5.3 几何平均数的计算 93
3.5.4 众数的计算 95
3.5.5 中位数的计算 96
3.5.6 方差和标准差的计算 98
3.5.7 偏态系数和峰态系数的计算 99
3.5.8 计算描述统计指标的综合函数 99
3.6 案例分析 100
第4章 抽样分布与参数估计 104
案例导入:大学生消费调查:一个月花费多少 104
4.1 抽样分布 105
4.1.1 几种常用的抽样分布 105
4.1.2 样本均值的抽样分布 108
4.1.3 样本比例的抽样分布 110
4.1.4 样本方差的抽样分布 111
4.1.5 与抽样分布有关的Excel和R函数 112
4.2 点估计及其评价标准 114
4.2.1 点估计的方法 115
4.2.2 点估计的评价标准 119
4.3 区间估计 121
4.3.1 区间估计的含义 121
4.3.2 单个总体参数的区间估计 121
4.3.3 两个总体参数的区间估计 131
第5章 假设检验 138
案例导入:男女婚嫁的假设检验 138
5.1 假设检验的一般问题 139
5.1.1 假设检验的基本思想与过程 139
5.1.2 双侧检验和单侧检验 141
5.1.3 假设检验的两类错误 142
5.1.4 假设检验的P值 142
5.2 正态总体参数的假设检验 144
5.2.1 单个正态总体参数的假设检验 144
5.2.2 两个正态总体参数的假设检验 153
5.3 总体比例的假设检验 164
5.3.1 单个总体比例的检验 164
5.3.2 两个总体比例的检验 167
5.4 非参数检验 169
5.4.1 χ2检验 170
5.4.2 Kolmogorov-Smirnov检验 177
5.4.3 正态性检验 179
5.4.4 符号检验 183
5.4.5 wilcoxon符号秩检验 186
第6章 方差分析 191
案例导入:如何检验安眠药的疗效 191
6.1 单因素方差分析 192
6.1.1 方差分析的基本假定 192
6.1.2 单因素方差分析的基本原理 193
6.1.3 单因素方差分析表的计算 195
6.1.4 多重比较 198
6.1.5 方差齐性检验 200
6.2 双因素方差分析 201
6.2.1 无交互作用的双因素方差分析 201
6.2.2 有交互作用的双因素方差分析 206
6.3 案例分析 212
6.3.1 问题的提出 212
6.3.2 数据的适用性检验 212
6.3.3 方差分析 214
6 3.4 结论 215
第7章 相关分析与回归分析 216
案例导入:花粉量对防晒霜的销量有影响吗 216
7.1 相关分析 217
7.1.1 变量之间的关系 217
7.1.2 相关分析与回归分析 218
7.1.3 相关系数及其检验 218
7.1.4 等级相关关系 223
7.2 一元线性回归 226
7.2.1 一元线性回归模型 227
7.2.2 参数的最小二乘估计 228
7.2.3 一元线性回归模型的评价与检验 231
7.2.4 一元线性回归的预测 236
7.3 多元线性回归 238
7.3.1 多元线性回归模型 238
7.3.2 参数的最小二乘估计 239
7.3.3 多元线性回归模型的拟合优度 241
7.3.4 多元线性回归模型的显著性检验 242
7.3.5 多元线性回归模型的预测 245
7.3.6 线性回归分析的几个常用R函数介绍 246
7.4 线性回归模型的诊断 247
7.4.1 方差齐性的检验 247
7.4.2 序列相关性的检验 253
7.4.3 多重共线性的检验 258
7.4.4 正态性检验 261
7.4.5 线性回归案例分析 265
7.5 非线性回归 272
7.5.1 可线性化模型 272
7.5.2 不可线性化模型 276
第8章 时间序列分析与预测 281
案例导入:如何预测产品的销售量 281
8.1 时间序列概述 282
8.1.1 时间序列的概念 282
8.1.2 时间序列的因素分解 282
8.2 时间序列的描述性分析 283
8.2.1 图形分析 283
8.2.2 水平分析 285
8.2.3 速度分析 289
8.2.4 速度分析应注意的问题 294
8.3 时间序列预测的一般问题 295
8.4 平稳时间序列的预测 296
8.4.1 移动平均法 296
8.4.2 指数平滑法 301
8.5 趋势型时间序列的预测 304
8.5.1 考虑趋势的平滑法 304
8.5.2 趋势外推法 313
8.6 复合型时间序列的预测 326
8.6.1 季节性回归预测法 326
8.6.2 分解预测法 326
8.6.3 温特线性与季节指数平滑预测法 331
8.6.4 案例分析 333
附录A 常用统计表 341
标准正态分布函数表 341
标准正态分布分位数表(下侧) 342
t分布分位数表(上侧) 344
χ2分布分位数表(上侧) 345
F分布分位数表 346
D.W.检验临界值表 347
附录B 书中用到的R程序包及函数 349
已有的R程序包和函数 349
本书自编的statsup包中的R函数及用途 353