第1章 数据与R 1
1.1 数据与统计学 1
1.1.1 什么是统计学 1
1.1.2 变量与数据 2
1.1.3 数据的来源 3
1.2 R的初步使用 4
1.2.1 R的下载与安装 4
1.2.2 对象赋值与运行 5
1.2.3 查看帮助文件 6
1.2.4 包的安装与加载 7
1.3 创建R数据 7
1.3.1 在R中录入数据 8
1.3.2 数据读取和保存 9
1.3.3 数据使用和编辑 12
1.3.4 数据类型的转换 17
1.3.5 生成随机数 18
1.3.6 数据抽样与筛选 19
1.4 编写R函数 21
1.5 图形控制和布局 22
1.5.1 par函数 22
1.5.2 layout函数 23
习题 25
第2章 数据的可视化 27
2.1 数据的频数分布 27
2.1.1 类别数据的频数分布 27
2.1.2 数值数据的类别化 34
2.2 类别数据的可视化 37
2.2.1 条形图及其变种 37
2.2.2 饼图及其变种 43
2.3 数值数据的可视化 45
2.3.1 展示数据分布的图形 45
2.3.2 展示变量间关系的图形 61
2.3.3 比较多样本相似性的图形 69
2.3.4 时间序列图 76
2.4 洛伦茨曲线 77
2.5 使用图表的注意事项 80
习题 81
第3章 数据的描述统计量 85
3.1 描述水平的统计量 85
3.1.1 平均数 85
3.1.2 分位数 87
3.1.3 众数 89
3.2 描述差异的统计量 90
3.2.1 极差和四分位差 90
3.2.2 方差和标准差 91
3.2.3 变异系数 92
3.2.4 标准分数 94
3.3 描述分布形状的统计量 95
3.3.1 偏度系数 95
3.3.2 峰度系数 96
3.4 数据的综合描述 97
3.4.1 几个常用的R函数 97
3.4.2 一个综合描述的例子 99
习题 105
第4章 随机变量的概率分布 108
4.1 什么是概率 108
4.2 随机变量的概率分布 109
4.2.1 随机变量及其概括性度量 109
4.2.2 随机变量的概率分布 111
4.2.3 其他几个重要的统计分布 117
4.3 样本统计量的概率分布 122
4.3.1 统计量及其分布 122
4.3.2 样本均值的分布 123
4.3.3 其他统计量的分布 126
4.3.4 统计量的标准误 128
习题 129
第5章 参数估计 130
5.1 参数估计的原理 130
5.1.1 点估计与区间估计 130
5.1.2 评量估计量的标准 134
5.2 总体均值的区间估计 138
5.2.1 一个总体均值的估计 138
5.2.2 两个总体均值之差的估计 141
5.3 总体比例的区间估计 145
5.3.1 一个总体比例的估计 145
5.3.2 两个总体比例之差的估计 148
5.4 总体方差的区间估计 150
5.4.1 一个总体方差的估计 150
5.4.2 两个总体方差比的估计 151
习题 152
第6章 假设检验 155
6.1 假设检验的原理 155
6.1.1 提出假设 155
6.1.2 做出决策 157
6.1.3 表述结果 160
6.1.4 效应量 161
6.2 总体均值的检验 161
6.2.1 一个总体均值的检验 161
6.2.2 两个总体均值之差的检验 165
6.3 总体比例的检验 171
6.3.1 一个总体比例的检验 171
6.3.2 两个总体比例之差的检验 172
6.4 总体方差的检验 174
6.4.1 一个总体方差的检验 174
6.4.2 两个总体方差比的检验 176
6.5 非参数检验 176
6.5.1 总体分布的检验 177
6.5.2 总体位置参数的检验 181
习题 185
第7章 类别变量分析 189
7.1 一个类别变量的拟合优度检验 189
7.1.1 期望频数相等 189
7.1.2 期望频数不等 191
7.2 两个类别变量的独立性检验 193
7.2.1 列联表与x2独立性检验 193
7.2.2 应用x2检验的注意事项 195
7.3 两个类别变量的相关性度量 196
7.3.1 φ系数和Cramer’s V系数 196
7.3.2 列联系数 197
习题 198
第8章 方差分析 200
8.1 方差分析的原理 200
8.1.1 什么是方差分析 200
8.1.2 误差分解 201
8.2 单因子方差分析 202
8.2.1 数学模型 202
8.2.2 效应检验 203
8.2.3 效应量分析 207
8.2.4 多重比较 207
8.3 双因子方差分析 213
8.3.1 数学模型 213
8.3.2 主效应分析 214
8.3.3 交互效应分析 220
8.4 方差分析的假定及其检验 225
8.4.1 正态性检验 225
8.4.2 方差齐性检验 227
8.5 单因子方差分析的非参数方法 231
习题 233
第9章 一元线性回归 236
9.1 确定变量间的关系 236
9.1.1 变量间的关系 236
9.1.2 相关关系的描述 237
9.1.3 关系强度的度量 239
9.2 模型估计和检验 241
9.2.1 回归模型与回归方程 241
9.2.2 参数的最小二乘估计 242
9.2.3 模型的拟合优度 245
9.2.4 模型的显著性检验 247
9.3 利用回归方程进行预测 249
9.3.1 均值的置信区间 249
9.3.2 个别值的预测区间 250
9.4 回归模型的诊断 253
9.4.1 残差与残差图 253
9.4.2 检验模型假定 255
习题 258
第10章 多元线性回归 261
10.1 多元线性回归模型及其参数估计 261
10.1.1 回归模型与回归方程 261
10.1.2 参数的最小二乘估计 262
10.2 拟合优度和显著性检验 266
10.2.1 模型的拟合优度 266
10.2.2 模型的显著性检验 268
10.2.3 模型诊断 269
10.3 多重共线性及其处理 271
10.3.1 多重共线性及其识别 272
10.3.2 变量选择与逐步回归 274
10.4 相对重要性和模型比较 278
10.4.1 自变量的相对重要性 278
10.4.2 模型比较 280
10.5 利用回归方程进行预测 282
10.6 哑变量回归 284
10.6.1 在模型中引入哑变量 284
10.6.2 含有一个哑变量的回归 284
习题 291
第11章 时间序列预测 294
11.1 时间序列的成分和预测方法 294
11.1.1 时间序列的成分 294
11.1.2 预测方法的选择与评估 297
11.2 指数平滑预测 298
11.2.1 指数平滑模型的一般表达 298
11.2.2 简单指数平滑预测 300
11.2.3 Holt指数平滑预测 303
11.2.4 Winter指数平滑预测 305
11.3 趋势外推预测 308
11.3.1 线性趋势预测 308
11.3.2 非线性趋势预测 311
11.4 分解预测 317
11.5 时间序列平滑 321
习题 324
附录1求置信区间的自助法 327
附录2本书使用的R函数 335
参考书目 338