第1章 什么是数据分析 1
1.1一眼就看到结论还需要数据分析吗 1
1.1.1企业数据量 2
1.1.2数据复杂度 2
1.1.3数据颗粒度 3
1.2数据分析能给我们带来什么 4
1.2.1了解数据的整体状况 4
1.2.2快速查询数据 5
1.2.3数据之间关系的探索 5
1.2.4业务预测 6
1.3数据分析的几大抓手 6
1.3.1足够多的数据 6
1.3.2数据质量 6
1.3.3合适的工具 7
1.3.4分析结果的呈现 7
1.4数据分析的流程 7
1.4.1数据采集 7
1.4.2数据整理 8
1.4.3制表 11
1.4.4数据分析 11
1.4.5数据展示(呈现) 12
1.5如何成为数据分析高手 12
1.5.1“拳不离手,曲不离口” 12
1.5.2熟练掌握常用工具 12
1.5.3最好能编点程序 13
1.5.4一定要通晓业务 14
第2章 数据分析的理论、工具、模型 15
2.1基本概念和术语 15
2.1.1基本概念 15
2.1.2术语 22
2.2选择称手的软件工具 26
2.2.1 EXCEL 27
2.2.2 VBA 27
2.2.3 Access 27
2.2.4 SPSS 28
2.2.5 XLSTAT 29
2.2.6 Modeler 29
2.2.7 R语言 30
2.3在分析需求和模型之间搭起桥梁 30
2.3.1识别需求 30
2.3.2分解需求 30
2.3.3选择工具和模型 31
第3章 数据采集与整理 32
3.1数据采集的几条重要原则 32
3.1.1要足够“复杂” 32
3.1.2要足够“细” 33
3.1.3要有“跨度” 33
3.1.4要有可行性 34
3.2用“逐步推进法”推测需要的数据 34
3.3耗时耗力的数据整理过程 35
3.3.1重复、空行、空列数据删除 36
3.3.2缺失值的填充和分析 39
3.3.3数据间逻辑的排查 45
3.4数据量太大了怎么办 47
3.4.1放到数据库中处理 47
3.4.2用专业工具处理 47
3.4.3数据抽样 51
第4章 数据分析的基础:制表(上) 53
4.1以数据合并为目标的制表 53
4.1.1跨工作表合并 53
4.1.2跨工作簿合并 55
4.2以数据筛选为目标的制表 56
4.2.1普通数据筛选 57
4.2.2高级筛选 60
4.2.3计算筛选 62
4.2.4函数筛选 63
4.3以获得概要数据为目标的制表 64
4.3.1分类汇总方法 64
4.3.2数据透视表汇总 68
第5章 数据分析的基础:制表(下) 70
5.1“七个百分比”让你懂得大部分表格类型 70
5.1.1行总计的百分比 70
5.1.2列总计的百分比 73
5.1.3全部总计的百分比 74
5.1.4父行(列)的百分比 74
5.1.5累计占比 75
5.1.6环比 78
5.1.7同比 79
5.2分组功能经常让分析峰回路转 81
5.2.1文本的分组 81
5.2.2等步长的数据分组 83
5.2.3不等步长的数据分组 86
5.2.4日期型的分组 88
5.3随意生成各种派生指标 89
5.3.1添加字段 89
5.3.2添加项 91
5.4从大数据库中挑选要分析的数据:Microsoft Query 92
5.5强大的SQL 97
5.5.1 SQL的基本语法 97
5.5.2 SQL的应用 97
第6章 数据扫描:给数据做体检 100
6.1在EXCEL中给数据做扫描 100
6.2 SPSS中给数据做扫描 103
6.3在Modeler中给数据做扫描 105
6.4其他相应的指标 108
第7章 数据标注:给数据上色 110
7.1大数据块的整体标注 111
7.1.1突出显示单元格规则 111
7.1.2特殊数据选取规则 112
7.2根据业务逻辑在数据中标注上色 113
7.2.1数据条、色阶、图标集的应用 113
7.2.2规则的理解 115
7.2.3根据业务需求改变规则 118
7.3采用公式实现复杂强大的数据标注 119
7.3.1理解逻辑表达式的含义 119
7.3.2复杂逻辑公式的应用 120
7.4如何在一张表格中实现多种标注规则 123
7.4.1多规则的应用 123
7.4.2如何理解“遇真则停止” 125
第8章 找到数据中的“特殊分子” 127
8.1什么是异常值 127
8.2异常值的判断标准 128
8.3用绘图技巧找到异常值 129
8.3.1散点图 129
8.3.2面板图 130
8.4用公式函数法发掘异常值 135
8.5三倍标准差法 137
第9章 相关分析与决策树 140
9.1 Pearson相关 140
9.1.1应用场景 141
9.1.2输出指标的解析 141
9.2典型相关分析 145
9.2.1操作步骤 145
9.2.2结果解读 147
9.3决策树 149
9.3.1什么时候需要用决策树 149
9.3.2决策树的操作和指标解释 150
第10章 聚类 155
10.1多维度数据的分类怎么办 155
10.1.1低维度数据的分类方法 155
10.1.2高维度数据的分类需求 157
10.1.3常用的聚类操作介绍 157
10.2聚类的烦恼1:如何面对数量级差别大的数据 165
10.3聚类的烦恼2:如何判断聚类的质量 167
第11章 回归 168
11.1如何寻找现有数据的内在规律 168
11.1.1什么是数据拟合 169
11.1.2多元线性回归 171
11.2 logistic回归 173
11.2.1回归(客户“买”与“不买”) 173
11.2.2多元logistic回归(多个品牌的选择) 176
11.2.3多元有序logistic回归 181
第12章 关联分析 183
12.1因果关系的弱化 183
12.2关联分析的指标 184
12.2.1支持度 184
12.2.2置信度 185
12.2.3提升度 185
12.3什么样的数据适合做关联分析 186
12.3.1商超数据 186
12.3.2金融数据 186
12.3.3生产质量数据 187
12.4关联分析的具体操作 187
第13章 预测 191
13.1什么是预测,预测的准确度高吗 191
13.2移动平滑 193
13.3指数平滑 194
13.3.1二次指数平滑 194
13.3.2三次指数平滑 195
13.4对周期性数据的分解 198
13.5 ARIMA预测法 201
第14章 高级绘图技巧 206
14.1怎样才算图画得好 206
14.2双轴图的技巧和运用 207
14.3不同数量级数据的高效对比展示 211
14.4数据标签的妙用 215
14.5图形中的重点标注 221
14.6绘图美学——多点审美素养 222
14.6.1整体布局 222
14.6.2线型的选择 223
14.6.3色彩对比 223
后记 数据分析经验之我见 224