数据分析实战 基于EXCLE和SPSS系列工具的实践PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:纪贺元著
- 出 版 社:北京:机械工业出版社
- 出版年份:2017
- ISBN:9787111566670
- 页数:226 页
第1章 什么是数据分析 1
1.1一眼就看到结论还需要数据分析吗 1
1.1.1企业数据量 2
1.1.2数据复杂度 2
1.1.3数据颗粒度 3
1.2数据分析能给我们带来什么 4
1.2.1了解数据的整体状况 4
1.2.2快速查询数据 5
1.2.3数据之间关系的探索 5
1.2.4业务预测 6
1.3数据分析的几大抓手 6
1.3.1足够多的数据 6
1.3.2数据质量 6
1.3.3合适的工具 7
1.3.4分析结果的呈现 7
1.4数据分析的流程 7
1.4.1数据采集 7
1.4.2数据整理 8
1.4.3制表 11
1.4.4数据分析 11
1.4.5数据展示(呈现) 12
1.5如何成为数据分析高手 12
1.5.1“拳不离手,曲不离口” 12
1.5.2熟练掌握常用工具 12
1.5.3最好能编点程序 13
1.5.4一定要通晓业务 14
第2章 数据分析的理论、工具、模型 15
2.1基本概念和术语 15
2.1.1基本概念 15
2.1.2术语 22
2.2选择称手的软件工具 26
2.2.1 EXCEL 27
2.2.2 VBA 27
2.2.3 Access 27
2.2.4 SPSS 28
2.2.5 XLSTAT 29
2.2.6 Modeler 29
2.2.7 R语言 30
2.3在分析需求和模型之间搭起桥梁 30
2.3.1识别需求 30
2.3.2分解需求 30
2.3.3选择工具和模型 31
第3章 数据采集与整理 32
3.1数据采集的几条重要原则 32
3.1.1要足够“复杂” 32
3.1.2要足够“细” 33
3.1.3要有“跨度” 33
3.1.4要有可行性 34
3.2用“逐步推进法”推测需要的数据 34
3.3耗时耗力的数据整理过程 35
3.3.1重复、空行、空列数据删除 36
3.3.2缺失值的填充和分析 39
3.3.3数据间逻辑的排查 45
3.4数据量太大了怎么办 47
3.4.1放到数据库中处理 47
3.4.2用专业工具处理 47
3.4.3数据抽样 51
第4章 数据分析的基础:制表(上) 53
4.1以数据合并为目标的制表 53
4.1.1跨工作表合并 53
4.1.2跨工作簿合并 55
4.2以数据筛选为目标的制表 56
4.2.1普通数据筛选 57
4.2.2高级筛选 60
4.2.3计算筛选 62
4.2.4函数筛选 63
4.3以获得概要数据为目标的制表 64
4.3.1分类汇总方法 64
4.3.2数据透视表汇总 68
第5章 数据分析的基础:制表(下) 70
5.1“七个百分比”让你懂得大部分表格类型 70
5.1.1行总计的百分比 70
5.1.2列总计的百分比 73
5.1.3全部总计的百分比 74
5.1.4父行(列)的百分比 74
5.1.5累计占比 75
5.1.6环比 78
5.1.7同比 79
5.2分组功能经常让分析峰回路转 81
5.2.1文本的分组 81
5.2.2等步长的数据分组 83
5.2.3不等步长的数据分组 86
5.2.4日期型的分组 88
5.3随意生成各种派生指标 89
5.3.1添加字段 89
5.3.2添加项 91
5.4从大数据库中挑选要分析的数据:Microsoft Query 92
5.5强大的SQL 97
5.5.1 SQL的基本语法 97
5.5.2 SQL的应用 97
第6章 数据扫描:给数据做体检 100
6.1在EXCEL中给数据做扫描 100
6.2 SPSS中给数据做扫描 103
6.3在Modeler中给数据做扫描 105
6.4其他相应的指标 108
第7章 数据标注:给数据上色 110
7.1大数据块的整体标注 111
7.1.1突出显示单元格规则 111
7.1.2特殊数据选取规则 112
7.2根据业务逻辑在数据中标注上色 113
7.2.1数据条、色阶、图标集的应用 113
7.2.2规则的理解 115
7.2.3根据业务需求改变规则 118
7.3采用公式实现复杂强大的数据标注 119
7.3.1理解逻辑表达式的含义 119
7.3.2复杂逻辑公式的应用 120
7.4如何在一张表格中实现多种标注规则 123
7.4.1多规则的应用 123
7.4.2如何理解“遇真则停止” 125
第8章 找到数据中的“特殊分子” 127
8.1什么是异常值 127
8.2异常值的判断标准 128
8.3用绘图技巧找到异常值 129
8.3.1散点图 129
8.3.2面板图 130
8.4用公式函数法发掘异常值 135
8.5三倍标准差法 137
第9章 相关分析与决策树 140
9.1 Pearson相关 140
9.1.1应用场景 141
9.1.2输出指标的解析 141
9.2典型相关分析 145
9.2.1操作步骤 145
9.2.2结果解读 147
9.3决策树 149
9.3.1什么时候需要用决策树 149
9.3.2决策树的操作和指标解释 150
第10章 聚类 155
10.1多维度数据的分类怎么办 155
10.1.1低维度数据的分类方法 155
10.1.2高维度数据的分类需求 157
10.1.3常用的聚类操作介绍 157
10.2聚类的烦恼1:如何面对数量级差别大的数据 165
10.3聚类的烦恼2:如何判断聚类的质量 167
第11章 回归 168
11.1如何寻找现有数据的内在规律 168
11.1.1什么是数据拟合 169
11.1.2多元线性回归 171
11.2 logistic回归 173
11.2.1回归(客户“买”与“不买”) 173
11.2.2多元logistic回归(多个品牌的选择) 176
11.2.3多元有序logistic回归 181
第12章 关联分析 183
12.1因果关系的弱化 183
12.2关联分析的指标 184
12.2.1支持度 184
12.2.2置信度 185
12.2.3提升度 185
12.3什么样的数据适合做关联分析 186
12.3.1商超数据 186
12.3.2金融数据 186
12.3.3生产质量数据 187
12.4关联分析的具体操作 187
第13章 预测 191
13.1什么是预测,预测的准确度高吗 191
13.2移动平滑 193
13.3指数平滑 194
13.3.1二次指数平滑 194
13.3.2三次指数平滑 195
13.4对周期性数据的分解 198
13.5 ARIMA预测法 201
第14章 高级绘图技巧 206
14.1怎样才算图画得好 206
14.2双轴图的技巧和运用 207
14.3不同数量级数据的高效对比展示 211
14.4数据标签的妙用 215
14.5图形中的重点标注 221
14.6绘图美学——多点审美素养 222
14.6.1整体布局 222
14.6.2线型的选择 223
14.6.3色彩对比 223
后记 数据分析经验之我见 224
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《分析化学》陈怀侠主编 2019
- 《Maya 2018完全实战技术手册》来阳编著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《白雪公主分面包 分数》(韩)车宝金文 2016
- 《Python3从入门到实战》董洪伟 2019
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《语文教育教学实践探索》陈德收 2018
- 《彼得·布鲁克导演实践研究》邓小玲著 2019
- 《积古斋钟鼎彝器款识 下》(清)阮元著 2019
- 《血染的红军利剑·钟纬剑》屈继元著 2019
- 《积古斋钟鼎彝器款识 上》(清)阮元著 2019
- 《私立高等教育研究》陈武元著 2019
- 《湿法磷酸绿色制造》李兵,刘作华,陶长元著 2019
- 《我们为什么活得如此焦虑》余小元著 2019
- 《十三五规划教材 生理学 第4版 第6轮》唐四元著 2017
- 《高等数学教学与思维能力培养》范林元著 2019
- 《C语言从新手到高手》关淞元著 2020
- 《生命只有一次 一位医生面对生命的思索》徐超元著 2014
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019