数据仓库与数据分析教程PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:王珊,李翠平,李盛恩等编著
- 出 版 社:北京:高等教育出版社
- 出版年份:2012
- ISBN:9787040341300
- 页数:222 页
第一篇 数据仓库技术 2
第一章 从数据库到数据仓库 2
1.1 数据仓库产生的原因 2
1.1.1 操作型数据处理 2
1.1.2 分析型数据处理 3
1.1.3 两种数据处理模式的差别 4
1.1.4 数据库系统的局限性 5
1.2 数据仓库的基本概念 6
1.2.1 主题与面向主题 7
1.2.2 数据仓库的其他三个特征 11
1.2.3 数据仓库的功能 13
1.3 数据仓库的体系结构 14
1.3.1 体系结构 14
1.3.2 数据集市 16
小结 20
习题 20
第二章 操作数据存储 21
2.1 什么是ODS 22
2.1.1 ODS的定义及特点 22
2.1.2 ODS的功能和实现机制 22
2.2 DB~ODS~DW体系结构 26
2.2.1 ODS与DW 26
2.2.2 DB~ODS~DW三层体系结构 27
小结 29
习题 29
第三章 数据仓库中的数据及组织 30
3.1 数据仓库中的数据组织 30
3.2 数据仓库中数据的追加 32
3.3 数据仓库中的元数据 33
3.3.1 元数据的定义 33
3.3.2 元数据的分类 34
3.3.3 元数据管理的标准化 36
小结 39
习题 39
第二篇 联机分析处理技术 42
第四章 概述及模型 42
4.1 OLAP技术概述 42
4.1.1 OLAP的起源 42
4.1.2 OLAP的定义 42
4.1.3 OLAP与OLTP的区别 43
4.1.4 OLAP核心技术 43
4.2 多维数据模型 44
4.2.1 基本概念 44
4.2.2 星形、雪片和事实群模型 49
4.3 多维分析操作 51
4.3.1 多维分析基础:聚集 52
4.3.2 常用多维分析操作 53
4.3.3 其他多维分析操作 55
4.3.4 聚集的一些限制 57
4.3.5 水平层次结构和非水平层次结构 59
4.4 多维查询语言 60
4.4.1 MDX简介 61
4.4.2 MDX对象模型 62
4.5 多维数据展示 63
4.5.1 三维数据展示 63
4.5.2 高维数据展示 64
小结 65
习题 65
第五章 数据方体的存储、预计算和缩减 66
5.1 数据方体的存储 66
5.1.1 MOLAP 66
5.1.2 ROLAP 70
5.1.3 MOLAP和ROLAP实现机制的比较 73
5.2 数据方体的预计算 75
5.2.1 预计算的相关概念 75
5.2.2 数据方体格结构 76
5.2.3 数据方体格存储方法 77
5.3 完整数据方体的预计算方法 78
5.3.1 流水线算法 78
5.3.2 BUC算法 80
5.4 部分数据方体的预计算方法 83
5.4.1 BPUS算法 84
5.4.2 PBS算法 87
5.5 数据方体的缩减技术 88
5.5.1 Drawf数据方体 88
5.5.2 Condensed数据方体 90
5.5.3 Quotient数据方体 91
小结 93
习题 93
第六章 数据方体的索引、查询和维护 94
6.1 数据方体的索引技术 94
6.1.1 树索引 94
6.1.2 位图索引 99
6.2 数据方体的查询处理和优化技术 101
6.2.1 子查询划分技术 102
6.2.2 子查询处理及优化技术 105
6.3 数据方体的维护技术 106
小结 107
习题 107
第三篇 数据挖掘技术 110
第七章 数据挖掘概述 110
7.1 数据挖掘简介 110
7.1.1 数据挖掘的特点 110
7.1.2 数据挖掘与KDD 111
7.1.3 数据挖掘与OLAP 112
7.1.4 数据挖掘与数据仓库 113
7.1.5 数据挖掘的分类 113
7.1.6 数据挖掘的应用 114
7.2 数据挖掘算法的组件化思想 116
7.2.1 模型或模式结构 116
7.2.2 数据挖掘的任务 117
7.2.3 评分函数 118
7.2.4 搜索和优化方法 118
7.2.5 数据管理策略 119
7.2.6 组件化思想的应用 119
小结 120
习题 120
第八章 频繁模式挖掘 121
8.1 频繁项集和关联规则 121
8.1.1 问题描述 122
8.1.2 关联规则分类 124
8.1.3 关联规则挖掘的经典算法Apriori 125
8.1.4 关联规则挖掘的重要算法FP-Growth 133
8.1.5 其他关联规则挖掘方法 135
8.1.6 关联规则的兴趣度 137
8.2 序列模式挖掘 138
8.2.1 问题描述 138
8.2.2 GSP算法 140
8.2.3 PrefixSpan算法 143
8.3 频繁子图挖掘 145
8.3.1 问题描述 145
8.3.2 基于Apriori的宽度优先算法 146
8.3.3 基于FP-Growth的深度优先搜索算法 147
小结 148
习题 149
第九章 预测建模:分类和回归 150
9.1 预测建模简介 150
9.1.1 用于预测的模型结构 151
9.1.2 用于预测的评分函数 154
9.1.3 用于预测的搜索和优化策略 154
9.2 决策树分类 155
9.2.1 建树阶段 156
9.2.2 剪枝阶段 162
9.2.3 分类规则的生成 162
9.2.4 可扩展性问题 163
9.2.5 其他问题 163
9.3 贝叶斯分类 164
9.3.1 基本概念 164
9.3.2 朴素贝叶斯分类 166
9.4 支持向量机分类 167
9.4.1 线性可分时的二元分类问题 168
9.4.2 线性不可分时的二元分类问题 171
9.4.3 多元分类问题 172
9.4.4 可扩展性问题 173
9.5 人工神经网络分类 173
9.5.1 神经网络的组成 173
9.5.2 神经网络的分类方法 175
小结 178
习题 178
第十章 描述建模:聚类 180
10.1 聚类分析简介 180
10.1.1 对象间的相似性 180
10.1.2 其他相似性度量 183
10.2 聚类方法概述 184
10.2.1 基于划分的聚类方法 185
10.2.2 基于密度的聚类方法 190
10.2.3 基于层次的聚类方法 194
10.2.4 基于模型的聚类方法 201
10.2.5 基于方格的聚类方法 203
小结 204
习题 205
附录 产品与工具 206
附录A IBM数据仓库解决方案 206
附录B Oracle数据仓库解决方案 209
附录C Microsoft SQLServer 2005数据仓库解决方案 210
附录D Sybase数据仓库解决方案 211
附录E Group 1 Sagent介绍 211
附录F Informatica介绍 212
参考文献 214
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《分析化学》陈怀侠主编 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《名医教你练走颈肩腰腿痛》许学猛 2018
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《全国高等中医药行业“十三五”创新教材 中医药学概论》翟华强 2019
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《习近平总书记教育重要论述讲义》本书编写组 2020
- 《办好人民满意的教育 全国教育满意度调查报告》(中国)中国教育科学研究院 2019
- 《高等数学试题与详解》西安电子科技大学高等数学教学团队 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《教育学考研应试宝典》徐影主编 2019
- 《语文教育教学实践探索》陈德收 2018
- 《家庭音乐素养教育》刘畅 2018