当前位置:首页 > 工业技术
数据分析实战  基于EXCLE和SPSS系列工具的实践
数据分析实战  基于EXCLE和SPSS系列工具的实践

数据分析实战 基于EXCLE和SPSS系列工具的实践PDF电子书下载

工业技术

  • 电子书积分:10 积分如何计算积分?
  • 作 者:纪贺元著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2017
  • ISBN:9787111566670
  • 页数:226 页
图书介绍:本书分为三大部分,第一部分基础篇(第1章和第2章)主要介绍数据分析的概念、术语、方法、模型等,为后续的内容展开奠定基础。第二部分制表篇(第3章到第5章)介绍数据的采集、整理以及常用数据报表的制作。第三部分数据分析篇(第6章到第14章)占据了本书的大部分篇幅,囊括了常用的、有代表性的、实用的功能,包括数据扫描、数据标注、异常值分析、回归等。
《数据分析实战 基于EXCLE和SPSS系列工具的实践》目录

第1章 什么是数据分析 1

1.1一眼就看到结论还需要数据分析吗 1

1.1.1企业数据量 2

1.1.2数据复杂度 2

1.1.3数据颗粒度 3

1.2数据分析能给我们带来什么 4

1.2.1了解数据的整体状况 4

1.2.2快速查询数据 5

1.2.3数据之间关系的探索 5

1.2.4业务预测 6

1.3数据分析的几大抓手 6

1.3.1足够多的数据 6

1.3.2数据质量 6

1.3.3合适的工具 7

1.3.4分析结果的呈现 7

1.4数据分析的流程 7

1.4.1数据采集 7

1.4.2数据整理 8

1.4.3制表 11

1.4.4数据分析 11

1.4.5数据展示(呈现) 12

1.5如何成为数据分析高手 12

1.5.1“拳不离手,曲不离口” 12

1.5.2熟练掌握常用工具 12

1.5.3最好能编点程序 13

1.5.4一定要通晓业务 14

第2章 数据分析的理论、工具、模型 15

2.1基本概念和术语 15

2.1.1基本概念 15

2.1.2术语 22

2.2选择称手的软件工具 26

2.2.1 EXCEL 27

2.2.2 VBA 27

2.2.3 Access 27

2.2.4 SPSS 28

2.2.5 XLSTAT 29

2.2.6 Modeler 29

2.2.7 R语言 30

2.3在分析需求和模型之间搭起桥梁 30

2.3.1识别需求 30

2.3.2分解需求 30

2.3.3选择工具和模型 31

第3章 数据采集与整理 32

3.1数据采集的几条重要原则 32

3.1.1要足够“复杂” 32

3.1.2要足够“细” 33

3.1.3要有“跨度” 33

3.1.4要有可行性 34

3.2用“逐步推进法”推测需要的数据 34

3.3耗时耗力的数据整理过程 35

3.3.1重复、空行、空列数据删除 36

3.3.2缺失值的填充和分析 39

3.3.3数据间逻辑的排查 45

3.4数据量太大了怎么办 47

3.4.1放到数据库中处理 47

3.4.2用专业工具处理 47

3.4.3数据抽样 51

第4章 数据分析的基础:制表(上) 53

4.1以数据合并为目标的制表 53

4.1.1跨工作表合并 53

4.1.2跨工作簿合并 55

4.2以数据筛选为目标的制表 56

4.2.1普通数据筛选 57

4.2.2高级筛选 60

4.2.3计算筛选 62

4.2.4函数筛选 63

4.3以获得概要数据为目标的制表 64

4.3.1分类汇总方法 64

4.3.2数据透视表汇总 68

第5章 数据分析的基础:制表(下) 70

5.1“七个百分比”让你懂得大部分表格类型 70

5.1.1行总计的百分比 70

5.1.2列总计的百分比 73

5.1.3全部总计的百分比 74

5.1.4父行(列)的百分比 74

5.1.5累计占比 75

5.1.6环比 78

5.1.7同比 79

5.2分组功能经常让分析峰回路转 81

5.2.1文本的分组 81

5.2.2等步长的数据分组 83

5.2.3不等步长的数据分组 86

5.2.4日期型的分组 88

5.3随意生成各种派生指标 89

5.3.1添加字段 89

5.3.2添加项 91

5.4从大数据库中挑选要分析的数据:Microsoft Query 92

5.5强大的SQL 97

5.5.1 SQL的基本语法 97

5.5.2 SQL的应用 97

第6章 数据扫描:给数据做体检 100

6.1在EXCEL中给数据做扫描 100

6.2 SPSS中给数据做扫描 103

6.3在Modeler中给数据做扫描 105

6.4其他相应的指标 108

第7章 数据标注:给数据上色 110

7.1大数据块的整体标注 111

7.1.1突出显示单元格规则 111

7.1.2特殊数据选取规则 112

7.2根据业务逻辑在数据中标注上色 113

7.2.1数据条、色阶、图标集的应用 113

7.2.2规则的理解 115

7.2.3根据业务需求改变规则 118

7.3采用公式实现复杂强大的数据标注 119

7.3.1理解逻辑表达式的含义 119

7.3.2复杂逻辑公式的应用 120

7.4如何在一张表格中实现多种标注规则 123

7.4.1多规则的应用 123

7.4.2如何理解“遇真则停止” 125

第8章 找到数据中的“特殊分子” 127

8.1什么是异常值 127

8.2异常值的判断标准 128

8.3用绘图技巧找到异常值 129

8.3.1散点图 129

8.3.2面板图 130

8.4用公式函数法发掘异常值 135

8.5三倍标准差法 137

第9章 相关分析与决策树 140

9.1 Pearson相关 140

9.1.1应用场景 141

9.1.2输出指标的解析 141

9.2典型相关分析 145

9.2.1操作步骤 145

9.2.2结果解读 147

9.3决策树 149

9.3.1什么时候需要用决策树 149

9.3.2决策树的操作和指标解释 150

第10章 聚类 155

10.1多维度数据的分类怎么办 155

10.1.1低维度数据的分类方法 155

10.1.2高维度数据的分类需求 157

10.1.3常用的聚类操作介绍 157

10.2聚类的烦恼1:如何面对数量级差别大的数据 165

10.3聚类的烦恼2:如何判断聚类的质量 167

第11章 回归 168

11.1如何寻找现有数据的内在规律 168

11.1.1什么是数据拟合 169

11.1.2多元线性回归 171

11.2 logistic回归 173

11.2.1回归(客户“买”与“不买”) 173

11.2.2多元logistic回归(多个品牌的选择) 176

11.2.3多元有序logistic回归 181

第12章 关联分析 183

12.1因果关系的弱化 183

12.2关联分析的指标 184

12.2.1支持度 184

12.2.2置信度 185

12.2.3提升度 185

12.3什么样的数据适合做关联分析 186

12.3.1商超数据 186

12.3.2金融数据 186

12.3.3生产质量数据 187

12.4关联分析的具体操作 187

第13章 预测 191

13.1什么是预测,预测的准确度高吗 191

13.2移动平滑 193

13.3指数平滑 194

13.3.1二次指数平滑 194

13.3.2三次指数平滑 195

13.4对周期性数据的分解 198

13.5 ARIMA预测法 201

第14章 高级绘图技巧 206

14.1怎样才算图画得好 206

14.2双轴图的技巧和运用 207

14.3不同数量级数据的高效对比展示 211

14.4数据标签的妙用 215

14.5图形中的重点标注 221

14.6绘图美学——多点审美素养 222

14.6.1整体布局 222

14.6.2线型的选择 223

14.6.3色彩对比 223

后记 数据分析经验之我见 224

返回顶部