Excel在大数据挖掘中的应用PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:谢邦昌,朱建平,王小燕著
- 出 版 社:厦门:厦门大学出版社
- 出版年份:2016
- ISBN:9787561560129
- 页数:328 页
第一篇 基本知识 3
第一章 大数据与数据挖掘 3
1.1 大数据的定义 3
1.2 大数据的4V特征 3
1.3 大数据的预测魅力 4
1.4 数据挖掘定义 5
1.5 数据挖掘的重要性 6
1.6 数据挖掘功能 6
1.7 数据挖掘步骤 7
1.8 数据挖掘建模的标准CRISP-DM 7
1.9 大数据时代数据挖掘面临的挑战 9
第二章 数据挖掘运用理论及技术 10
2.1 回归分析 10
2.1.1 简单线性回归分析 10
2.1.2 多元回归分析 10
2.1.3 岭回归分析 11
2.1.4 Logistic回归分析 12
2.2 关联规则 12
2.3 聚类分析 12
2.4 判别分析 14
2.5 神经网络分析 15
2.6 决策树分析 17
2.7 其他分析方法 18
第三章 数据挖掘与其他相关领域的关系 20
3.1 数据挖掘与统计分析的不同 20
3.2 数据挖掘与数据仓储的关系 20
3.3 KDD与数据挖掘的关系 22
3.4 OLAP与数据挖掘的关系 22
3.5 数据挖掘与机器学习的关系 23
3.6 网络信息挖掘和数据挖掘有什么不同? 23
第四章 数据挖掘商业软件产品及其应用现状 25
4.1 数据挖掘工具分类 25
4.2 各工具的简介 25
4.3 客户关系管理(CRM) 26
4.4 数据挖掘在各行业的应用 27
第二篇 Excel 2013数据挖掘模型 31
第五章 安装与配置Excel 2013数据挖掘加载项 31
5.1 系统需求 31
5.2 开始安装 31
5.3 完成安装验证 35
5.4 配置设定 35
5.5 设定完成验证 40
第六章 Excel 2013数据挖掘入门 42
6.1 Excel 2013数据挖掘工具栏介绍 42
6.2 数据挖掘使用说明 42
6.2.1 目录 43
6.2.2 使用者入门 43
6.2.3 视频和教程 44
6.3 数据挖掘连接设定 44
6.3.1 设定目前的连接 44
6.3.2 跟踪 46
6.4 数据准备 47
6.4.1 浏览数据 47
6.4.2 清除数据 50
6.4.3 分割数据 53
6.5 数据建模 57
6.6 准确性和验证 58
6.6.1 准确性图表 58
6.6.2 分类矩阵 59
6.6.3 利润图 59
6.7 模型用法 60
6.7.1 浏览 61
6.7.2 查询 63
6.8 模型管理 64
6.8.1 重命名挖掘结构 64
6.8.2 删除挖掘结构 65
6.8.3 清除挖掘结构 65
6.8.4 使用原始数据处理挖掘结构 65
6.8.5 用新数据处理挖掘结构 65
6.8.6 导出挖掘结构 67
6.8.7 导入挖掘结构 67
第七章 决策树 68
7.1 基本概念 68
7.2 决策树模块的建立:三种形式 68
7.3 决策树与判别函数比较 68
7.4 计算方法 69
7.4.1 制定预测精确性的标准规范 69
7.4.2 选择分裂(分层)技术 70
7.4.3 定义停止分裂(分层)的时间点 70
7.4.4 选择适当大小的决策树 71
7.5 Excel 2013决策树算法操作步骤 71
第八章 贝叶斯概率分类 82
8.1 基本概念 82
8.2 Excel 2013贝叶斯概率分类操作步骤 85
第九章 关联规则 95
9.1 基本概念 95
9.2 关联规则的种类 96
9.3 关联规则的算法:Apriori算法 97
9.3.1 执行步骤 97
9.3.2 优点 97
9.3.3 缺点 97
9.4 Excel 2013关联规则操作步骤 97
第十章 聚类分析 103
10.1 基本概念 103
10.1.1 搜集数据 103
10.1.2 转换成相似矩阵 103
10.2 层次聚类分析(hierarchical clustering methods) 104
10.2.1 系统聚类法 104
10.2.2 逐步聚类法 104
10.2.3 逐步分解法 104
10.2.4 有序样本的聚类 104
10.3 聚类分析原理 105
10.4 Excel 2013聚类分析操作步骤 109
第十一章 时序聚类 126
11.1 基本概念 126
11.2 相关研究 126
11.3 Excel 2013时序聚类操作步骤 128
第十二章 线性回归 138
12.1 基本概念 138
12.2 简单回归分析 139
12.3 多元回归分析 142
12.4 回归变量的选择 144
12.5 Excel 2013线性回归操作步骤 145
第十三章 Logistic回归 155
13.1 基本概念 155
13.2 logit变换 156
13.3 Logistic分布 157
13.4 2×2表的Logistic回归模型 158
13.5 Excel 2013 Logistic回归操作步骤 159
第十四章 神经网络 174
14.1 基本概念 174
14.2 神经网络的特性 176
14.3 神经网络的架构与训练算法 176
14.4 神经网络应用 177
14.5 神经网络的优缺点 178
14.6 神经网络的限制 178
14.6 Excel 2013神经网络操作步骤 179
第十五章 时间序列分析 196
15.1 基本概念 196
15.2 时间序列的成分 199
15.2.1 趋势成分 199
15.2.2 循环成分 199
15.2.3 季节成分 200
15.2.4 不规则成分 200
15.3 利用修匀法预测 200
15.3.1 移动平均 201
15.3.2 加权移动平均 202
15.3.3 指数修匀 203
15.4 用趋势投射预测时间序列 205
15.5 预测含趋势与季节成分的时间序列 206
15.5.1 消除时间序列的季节性 206
15.5.2 消除季节性的时间序列,辨识趋势 206
15.5.3 循环成分 207
15.6 利用回归模型预测时间序列 207
15.7 其他预测模型 208
15.8 单变量时间序列预测模型 209
15.8.1 自回归模型(autoregressive models,AR model) 210
15.8.2 移动平均过程模型(moving average process model,MA model) 210
15.8.3 AR-MA模型(mixed AR-MA model) 210
15.8.4 季节循环性时间序列模型 210
15.9 时间趋势预测模型 211
15.10 Excel 2013时间序列操作步骤 212
第十六章 DMX介绍 217
16.1 DMX介绍 217
16.2 DMX函数介绍 219
16.2.1 模型建立 219
16.2.2 模型训练 220
16.2.3 模型使用(预测) 220
16.2.4 其他函数语法 221
16.3 DMX数据挖掘语法 224
16.3.1 决策树 225
16.3.2 贝叶斯概率分类 226
16.3.3 关联规则 226
16.3.4 聚类分析 227
16.3.5 时序聚类 228
16.3.6 线性回归分析 229
16.3.7 Logistic回归 230
16.3.8 神经网络 231
16.3.9 时间序列 232
16.4 DMX应用范例 233
16.4.1 分类(classification) 233
16.4.2 估计(estimation) 234
16.4.3 预测(prediction) 235
16.4.4 关联分组(affinity grouping) 236
16.4.5 同质分组(clustering) 237
第十七章 其他分析工具 238
17.1 分析关键影响因素 238
17.2 检测类别 242
17.3 从示例填充 245
17.4 预测 246
17.5 突出显示异常值 248
17.6 应用场景分析 250
17.6.1 目标查找 251
17.6.2 假设 253
第三篇 实例 257
第十八章 台湾房屋信用贷款违约状况分析 257
18.1 数据说明 257
18.2 建立模型 258
第十九章 台湾健康食品行业分析 267
19.1 数据说明 267
19.2 建立模型 269
19.2.1 准确性图表(预测列“违约注记”=1) 269
19.2.2 分类矩阵 271
附录 277
附录一 Power Query简介 277
1.Power Query简介 277
2.Power Query安装 277
3.Power Query进行数据分析实例 279
附录二 Power View简介 292
1.Power View简介 292
2.Power View操作 292
附录三 Power Map 301
1.Power Map简介 301
2.数据要求 301
3.安装Power Map 302
4.Power Map的功能实现 303
附录四 PowerPivot 310
1.PowerPivot加载 310
2.向PowerPivot工作簿中加载数据 312
3.在数据之间创建关系 318
4.创建计算列 321
5.创建数据透视表 325
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《虚拟流域环境理论技术研究与应用》冶运涛蒋云钟梁犁丽曹引等编著 2019
- 《当代翻译美学的理论诠释与应用解读》宁建庚著 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《大学化学实验》李爱勤,侯学会主编 2016
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017