数据仓库与数据挖掘概念、方法及图书馆应用PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:朱东妹著
- 出 版 社:安徽师范大学出版社
- 出版年份:2017
- ISBN:9787567630222
- 页数:242 页
第1章 概述 1
1.1 初识数据仓库 1
1.1.1 数据仓库的产生过程 1
1.1.2 数据仓库的体系结构 3
1.1.3 数据仓库的关键技术 4
1.2 初识数据挖掘 5
1.2.1 数据挖掘对象 5
1.2.2 数据挖掘过程 7
1.2.3 数据挖掘方法 8
1.3 数据仓库与数据挖掘的关系 10
1.4 数据仓库与数据挖掘工具 10
1.5 图书馆为什么需要数据仓库与数据挖掘 13
第2章 数据仓库 14
2.1 数据仓库概述 14
2.2 数据仓库与数据库的区别 15
2.3 数据仓库数据组织结构 16
2.4 数据仓库开发过程 18
2.4.1 规划分析阶段 18
2.4.2 设计实现阶段 18
2.4.3 使用维护阶段 21
2.5 案例:利用SQL Server 2012创建数据仓库 22
2.5.1 概念模型设计 22
2.5.2 逻辑模型设计 23
2.5.3 物理模型设计 26
第3章 数据抽取转换加载 37
3.1 ETL过程 37
3.1.1 数据抽取 37
3.1.2 数据转换 38
3.1.3 数据加载 39
3.2 T-SQL语句 40
3.2.1 数据定义语句 40
3.2.2 数据控制语句 40
3.2.3 数据操纵语句 41
3.3 SSIS服务 41
3.3.1 SSIS工具箱 41
3.3.2 SSIS包 42
3.4 案例:利用SQL Server 2012抽取、转换及加载数据 44
3.4.1 数据抽取 44
3.4.2 数据清理、转换 51
3.4.3 数据加载 53
第4章 联机分析处理 66
4.1 联机分析处理特性及评价 66
4.1.1 OLAP特性 66
4.1.2 OLAP评价准则 67
4.2 OLAP的一些基本概念 68
4.3 OLAP的基本操作 69
4.4 案例:利用SQL Server 2012创建OLAP立方 73
4.4.1 建立数据源 73
4.4.2 创建数据源视图 76
4.4.3 根据向导创建多维数据集 79
4.4.4 修改Cube中的维度和度量 86
4.4.5 部署项目 90
4.4.6 分析多维数据集 93
第5章 关联规则 98
5.1 基本概念 98
5.2 关联规则的分类 100
5.3 Apriori算法 101
5.3.1 Apriori性质 101
5.3.2 Apriori算法步骤 101
5.3.3 Apriori算法示例 102
5.4 Microsoft关联规则算法 106
5.4.1 Microsoft关联规则算法的参数 107
5.4.2 Microsoft关联规则算法的要求 108
5.5 案例:利用SQL Server 2012进行Microsoft关联规则挖掘 108
5.5.1 数据准备 108
5.5.2 实现挖掘任务 111
5.5.3 浏览模型 120
5.5.4 关联预测 124
第6章 分类 129
6.1 决策树算法 129
6.1.1 基本概念 129
6.1.2 ID3算法 130
6.1.3 ID3算法示例 132
6.1.4 由决策树提取分类规则 134
6.1.5 Microsoft决策树算法 134
6.2 贝叶斯分类算法 136
6.2.1 贝叶斯分类的基础——贝叶斯定理 136
6.2.2 朴素贝叶斯分类器 137
6.2.3 朴素贝叶斯分类示例 137
6.2.4 Microsoft Naive Bayes算法 138
6.3 神经网络算法 139
6.3.1 生物神经元与人工神经元 140
6.3.2 神经网络的激发函数 141
6.3.3 多层感知器 141
6.3.4 Microsoft神经网络算法 143
6.4 逻辑 回归算法 144
6.4.1 逻辑 回归算法概述 144
6.4.2 Microsoft逻辑 回归算法 145
6.5 案例:利用SQL Server 2012进行分类挖掘 146
6.5.1 数据准备 146
6.5.2 实现挖掘任务 148
6.5.3 浏览模型 160
6.5.4 挖掘性能分析 172
第7章 聚类 180
7.1 聚类分析 180
7.1.1 聚类分析中的数据结构 180
7.1.2 聚类分析中的数据类型 181
7.2 k-平均算法 185
7.3 EM算法 186
7.4 Microsoft聚类算法 186
7.4.1 Microsoft聚类算法的参数 187
7.4.2 Microsoft聚类算法的要求 187
7.5 案例:利用SQL Server 2012进行Microsoft聚类分析挖掘 188
7.5.1 数据准备 188
7.5.2 实现挖掘任务 190
7.5.3 浏览模型 197
第8章 线性回归 200
8.1 一元线性回归 200
8.2 多元线性回归 201
8.3 Microsoft线性回归算法 202
8.3.1 Microsoft线性回归算法的参教 202
8.3.2 Microsoft线性回归算法的要求 203
8.4 案例:利用SQL Server 2012进行Microsoft线性回归挖掘 203
8.4.1 数据准备 203
8.4.2 实现挖掘任务 204
8.4.3 浏览模型 211
第9章 时序 213
9.1 基本概念 213
9.2 简单平均法 214
9.3 移动平均法 214
9.3.1 简单移动平均 214
9.3.2 加权移动平均 215
9.4 指数平滑法 215
9.4.1 简单指数平滑法 215
9.4.2 考虑趋势调整的指数平滑法 216
9.4.3 考虑季节性调整的指数平滑法 217
9.5 ARIMA模型 218
9.5.1 平稳时间序列ARIMA模型的一般形式 218
9.5.2 非平稳时间序列ARIMA模型的一般形式 219
9.5.3 方法性工具 220
9.6 ARIMA模型示例 222
9.7 Microsoft时序算法 225
9.7.1 Microsoft时序算法的参数 225
9.7.2 Microsoft时序算法的要求 227
9.8 案例:利用SQL Server 2012进行Microsoft时序算法挖掘 227
9.8.1 数据准备 227
9.8.2 实现挖掘任务 230
9.8.3 浏览模型 237
主要参考文献 241
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《游历日本图经 第4册》(清)傅云龙撰 2019
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《元好问传》朱东润 2019
- 《劳动关系的法律调整》周宝妹著 2019
- 《三维信用论》吴晶妹著 2013
- 《精神科临床护理思维与实践》曹新妹著 2013
- 《张居正大传》朱东润著 2013
- 《循环经济法律政策研究:基于政策系统的视角》刘秋妹著 2013
- 《戴进研究》陈芳妹著 1981
- 《海盗传奇》欧阳云,陈子妹著 2009
- 《中国文学批评史大纲》朱东润著 2009
- 《宽容与超越 法国当代高等美术教育纵横谈》金妹著 2009
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《大学化学实验》李爱勤,侯学会主编 2016
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017