第1章 数据分析概述 1
1.1 什么是数据分析 2
1.2 数据分析六部曲 2
1.2.1 明确分析目的和内容 2
1.2.2 数据收集 3
1.2.3 数据预处理 3
1.2.4 数据分析 4
1.2.5 数据展现 5
1.2.6 报告撰写 6
1.3 数据分析方法简介 6
1.3.1 单纯的数据加工方法 6
1.3.2 基于数理统计的数据分析方法 7
1.3.3 基于数据挖掘的数据分析方法 8
1.3.4 基于大数据的数据分析方法 11
1.3.5 数理统计与数据挖掘的区别和联系 13
1.4 常用数据分析工具的安装 14
1.4.1 在Excel 2013中安装数据分析工具 14
1.4.2 数据分析软件SPSS的安装 16
1.5 重要知识点回顾 22
1.6 课后习题 23
第2章 描述性统计分析 24
2.1 直方图 25
2.1.1 什么是直方图 25
2.1.2 如何看直方图 25
2.1.3 如何画直方图 26
2.1.4 使用Excel 2013进行直方图的绘制 27
2.2 数据的计量尺度 30
2.3 数据的集中趋势 31
2.3.1 平均数 31
2.3.2 分位数 33
2.3.3 众数 34
2.4 数据的离中趋势 34
2.4.1 极差 35
2.4.2 分位距 35
2.4.3 平均差 36
2.4.4 方差与标准差 37
2.4.5 离散系数 38
2.5 数据分布的测定 40
2.5.1 数据偏态及其测定 40
2.5.2 数据峰度及其测定 41
2.5.3 数据偏度和峰度的作用 42
2.6 数据的展示——统计图 43
2.6.1 条形图与扇形图 43
2.6.2 折线图 44
2.6.3 茎叶图 45
2.6.4 箱线图 48
2.6.5 统计图小结 52
2.7 使用Excel实现数据的描述性统计及分析 52
2.7.1 使用Excel实现三国全部人物武力描述性统计 52
2.7.2 使用Excel分别实现三个国家人物武力描述性统计分析 54
2.7.3 使用Excel分别实现三个国家武将武力描述性统计分析 55
2.7.4 使用SPSS实现三个国家武将武力的分位数分析 56
2.8 重要知识点回顾 59
2.9 课后习题 59
第3章 数理统计基础 62
3.1 抽样估计基础 63
3.1.1 随机事件 63
3.1.2 随机事件的概率 64
3.1.3 随机变量及其概率分布 66
3.1.4 随机变量的数字特征 71
3.2 正态分布及三大分布 72
3.2.1 正态分布的概率密度函数 73
3.2.2 正态分布的特征 73
3.2.3 标准正态分布 74
3.2.4 基于正态分布的三大分布 77
3.3 中心极限定理 80
3.3.1 中心极限定理的提法 80
3.3.2 中心极限定理的内容 81
3.3.3 中心极限定理的意义与应用 81
3.4 重要知识点回顾 82
3.5 课后习题 83
第4章 抽样估计 86
4.1 抽样估计的基本概念 87
4.1.1 总体及总体指标 87
4.1.2 样本及样本指标 88
4.1.3 抽样估计的思想 89
4.1.4 抽样估计的理论基础 91
4.1.5 样本统计量及分布 92
4.2 抽样估计的方法——点估计 93
4.2.1 点估计 93
4.2.2 点估计精度和样本容量的关系 95
4.2.3 点估计的优缺点 96
4.3 抽样估计的误差 97
4.3.1 抽样估计的实际误差 97
4.3.2 抽样估计的平均误差 98
4.3.3 抽样估计的极限误差 102
4.4 抽样估计的方法——区间估计 102
4.4.1 抽样估计的精度及置信度 102
4.4.2 区间估计的方法 105
4.4.3 区间估计的步骤 106
4.5 抽样的组织形式和抽样数目的确定 107
4.5.1 抽样的组织形式 107
4.5.2 必要抽样数目的确定 109
4.6 重要知识点回顾 112
4.7 课后习题 113
第5章 假设检验 117
5.1 假设检验概述 118
5.1.1 假设检验的概念 118
5.1.2 假设检验的基本思想 118
5.1.3 假设检验在数据分析中的作用 119
5.2 假设检验的分析方法 119
5.2.1 假设检验的基本步骤 119
5.2.2 假设检验与区间估计的联系 122
5.2.3 假设检验中的两类错误 123
5.2.4 利用P值进行决策 124
5.2.5 应用假设检验需要注意的问题 125
5.3 常见的检验统计量 126
5.3.1 z检验统计量 126
5.3.2 t检验统计量 128
5.3.3 χ2检验统计量 129
5.3.4 F检验统计量 129
5.4 SPSS中常用的几种t检验实例 130
5.4.1 单样本t检验 130
5.4.2 两独立样本t检验 133
5.4.3 配对样本t检验 139
5.5 重要知识点回顾 143
5.6 课后习题 143
第6章 方差分析 147
6.1 方差分析 148
6.1.1 方差分析的概述 148
6.1.2 方差分析的几个概念 148
6.1.3 单因素方差分析中的基本假定 149
6.2 单因素方差分析 149
6.2.1 单因素方差分析的原理 149
6.2.2 单因素方差分析的原假设 150
6.2.3 单因素方差分析的统计量 151
6.2.4 单因素方差分析的基本步骤 152
6.3 使用SPSS实现三国武将武力差异分析 152
6.3.1 检验不同国家武将数据是否符合正态分布 153
6.3.2 单因素方差分析操作步骤及必要说明 155
6.3.3 对三国武将武力单因素方差分析结果的分析 160
6.4 使用SPSS实现三国文官智力差异分析 163
6.4.1 检验不同国家文官数据是否符合正态分布 163
6.4.2 单因素方差分析操作步骤及必要说明 165
6.4.3 对三国文官智力单因素方差分析结果的分析 167
6.5 数说汉室衰微与三足鼎立现象 169
6.6 重要知识点回顾 171
6.7 课后习题 171
第7章 相关与回归分析 175
7.1 变量间的关系 176
7.1.1 函数关系及特点 176
7.1.2 相关关系及特点 176
7.2 相关分析 177
7.2.1 相关分析及步骤 177
7.2.2 散点图的绘制 177
7.2.3 相关系数的计算 178
7.2.4 相关系数的显著性检验 182
7.3 使用SPSS实现相关分析 182
7.3.1 在SPSS中绘制散点图 182
7.3.2 在SPSS中进行正态性检验 185
7.3.3 相关系数的计算和检验 187
7.4 一元线性回归分析 189
7.4.1 一元回归模型及相关假定 190
7.4.2 一元线性回归方程及求法 190
7.4.3 回归模型的检验 191
7.4.4 回归直线的拟合优度 194
7.5 使用SPSS实现一元线性回归分析 195
7.5.1 画散点图和趋势线 195
7.5.2 简单相关分析 198
7.5.3 一元线性回归分析的操作步骤 199
7.5.4 一元线性回归分析的结果解读 205
7.6 重要知识点回顾 207
7.7 课后习题 208
附录A 三国人物数据 213
附录B CDA数据分析师致力于最好的数据分析人才建设 226
附录C 参考答案 230