数据仓库与数据挖掘PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:廖开际主编
- 出 版 社:北京市:北京大学出版社
- 出版年份:2008
- ISBN:9787301143131
- 页数:252 页
第1章 企业数据资源管理 1
1.1数据资源的概念 2
企业资源 2
数据资源 3
数据资源管理及其发展历程 3
1.2数据资源管理的意义 5
信息系统进入成熟阶段的重要标志 5
解决企业内部数据不一致问题的根本途径 5
数据资源的管理和应用是取得竞争优势的关键 6
1.3信息资源管理的相关技术 7
数据资源管理的技术框架 7
技术框架中的构成要素 8
技术框架中各部分的关联 10
1.4企业通过数据仓库与数据挖掘获得竞争优势 11
本章小结 14
思考与练习 19
第2章 数据仓库的概念与结构 22
2.1数据仓库的概念 23
数据仓库的定义 23
数据仓库的特征 24
数据集市 26
2.2数据仓库系统 27
数据源 27
数据仓库管理层 28
数据仓库工具集 28
2.3数据仓库中的数据组织 29
粒度的概念 30
面向主题的数据组织 30
数据分割 32
元数据的管理 33
本章小结 36
思考与练习 39
第3章 数据仓库的设计与开发 42
3.1数据仓库的开发过程及特点 43
数据仓库开发的生命周期 44
数据仓库开发的特点 45
数据仓库设计的主要内容 45
3.2数据模型设计 47
概念模型设计 47
逻辑模型设计 48
物理模型设计 55
3.3数据仓库的粒度设计 57
设计步骤 57
设计原则 59
3.4创建数据仓库的基本步骤 60
建立运营环境文档 60
选择数据仓库的实现技术 61
设计数据仓库模型 62
创建数据准备区 62
创建数据仓库数据库 62
从操作型系统中抽取数据 62
清理和转换数据 63
将数据装入数据仓库数据库 63
准备显示信息 64
将数据分发到数据集市 64
本章小结 64
思考与练习 69
第4章 联机分析处理 75
4.1 OLAP的基本概念 76
OLAP的发展背景 76
联机分析处理是数据仓库系统的一个应用 77
4.2 OLAP与多维分析 79
OLAP的一些基本概念 79
理解数据立方 80
OLAP的基本分析操作 81
4.3 OLAP的分类 87
ROLAP 87
MOLAP 87
HOLAP 87
4.4 OLAP的特性与不足 88
OLAP的特性 88
OLAP的不足 89
4.5 SQL Server 2005统一维度模型 90
结构 90
优点 92
本章小结 93
思考与练习 94
第5章 数据挖掘概述 98
5.1数据挖掘技术的由来 100
信息爆炸但知识贫乏 100
支持数据挖掘技术的基础 101
从商业数据到商业信息的进化 101
数据挖掘逐渐演变的过程 102
5.2数据挖掘的定义 102
技术角度的定义 102
商业角度的定义 103
数据挖掘与传统分析方法的区别 103
数据挖掘和数据仓库 103
数据挖掘和OLAP 104
数据挖掘、机器学习和统计 104
5.3数据挖掘发现的知识类型 105
广义知识 105
关联知识 105
分类知识 106
预测知识 106
偏差知识 107
5.4数据挖掘流程 107
知识发现过程 107
数据挖掘对象 109
数据挖掘任务 112
数据挖掘分类 115
数据预处理 117
5.5数据挖掘的方法和技术 121
信息论方法 121
集合论方法 121
神经网络方法 122
遗传算法 122
模糊数学 124
公式发现 124
可视化技术 124
知识表示 124
本章小结 126
思考与练习 129
第6章 数据预处理 133
6.1数据预处理的目的及方法 134
原始数据中存在的问题 135
数据预处理的常用方法 135
6.2数据清理 136
处理空缺值 137
噪声数据的处理 138
6.3数据集成 141
模式匹配 141
数据冗余 142
数据冲突 143
6.4数据变换 143
6.5数据归约 146
数据立方体聚集 146
维归约 147
数据压缩 149
数值归约 150
离散化和概念分层 153
本章小结 155
思考与练习 157
第7章 数据挖掘中的常用算法 162
7.1 Apriori算法 163
基本原理 163
Apriori算法的基本思想与分析 164
从频繁项集产生关联规则 166
7.2决策树算法 167
信息论的基本原理 168
ID3算法 169
树剪枝 172
由决策树提取分类规则 173
7.3神经网络算法 173
神经网络的基本原理 174
反向传播模型 175
定义神经网络拓扑结构 178
神经网络的工作过程 179
7.4聚类分析 180
聚类分析的概念 180
聚类分析中的数据类型 180
几种主要的聚类分析方法 184
K_means聚类分析算法 185
本章小结 187
思考与练习 189
第8章 SQL Server数据仓库与数据挖掘工具及其应用 197
8.1 SQL Server 2005的功能构架 198
8.2 SQL Server数据仓库设计与数据挖掘准备 199
SQL Server数据仓库创建思路 199
SQL Server数据挖掘过程 200
案例数据准备 201
8.3 SQL Server集成服务 203
SQL Server集成服务的作用 203
控制流 204
数据流 204
设计和使用ETL 206
8.4 SQL Server分析服务 209
创建Analysis Services项目 209
定义数据源 210
定义数据源视图 212
用Analysis Services创建维与多维数据集 214
部署Analysis Services项目 218
8.5 SQL Server中的数据挖掘工具与应用 219
8.6 SQL Server报表服务 222
创建报表 222
使用报表 226
本章小结 227
思考与练习 230
附录A 一个简易的数据挖掘工具——Weka 232
参考文献 252
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019