数据仓库与数据挖掘原理及应用PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:王丽珍等编著(云南大学信息学院)
- 出 版 社:北京:科学出版社
- 出版年份:2005
- ISBN:7030156579
- 页数:300 页
目录 1
第一篇 数据仓库及OLAP概念、原理和技术篇 1
第1章 数据仓库基本概念 1
1.1 从数据库到数据仓库 1
1.1.1 蜘蛛网问题 1
1.1.2 事务型系统和分析型系统的分离 4
1.2 什么是数据仓库 6
1.2.1 面向主题 6
1.2.2 集成 7
1.2.3 稳定性 8
1.2.4 随时间而变化 9
1.3 数据仓库的体系结构 9
1.3.1 数据仓库的体系结构 9
1.3.2 数据仓库中的关键名词 10
1.4.1 数据仓库的数据组织结构 13
1.4 数据仓库的数据组织 13
1.4.2 数据粒度与数据分割 14
1.4.3 数据仓库的数据组织形式 15
1.4.4 数据仓库的数据追加和清理 17
1.5 本章小结 19
习题 19
2.1 ETL 20
2.1.1 ETL概念 20
第2章 数据仓库中的ETL和元数据 20
2.1.2 ETL作用 23
2.1.3 ETL工具 23
2.2 元数据 26
2.2.1 什么是元数据 27
2.2.2 元数据的标准化 31
2.2.3 数据仓库中的元数据管理 32
2.2.4 在数据仓库项目中使用元数据的建议 34
2.3.1 外部数据和非结构化数据 35
2.3 外部数据 35
2.3.2 元数据和外部数据 36
2.3.3 外部数据的存储 36
2.3.4 外部数据的管理 37
2.4 本章小结 37
习题 38
第3章 数据仓库模型设计 39
3.1 数据仓库模型设计方法概述 39
3.2 数据仓库设计的三级数据模型 40
3.2.1 概念模型 41
3.2.2 逻辑模型 41
3.2.3 物理模型 41
3.2.4 三种模型之间的关系 41
3.2.5 高级模型、中级模型和低级模型 42
3.3.1 E-R模型 43
3.3 数据仓库的概念模型设计 43
3.3.2 面向对象的分析方法 46
3.4 数据仓库的逻辑模型设计 48
3.4.1 分析主题,确定当前要装载的主题 48
3.4.2 确定数据粒度的选择 49
3.4.3 确定数据分割策略 53
3.4.4 增加导出字段 54
3.4.5 定义关系模式 54
3.4.6 定义记录系统 55
3.5 数据仓库的物理模型设计 55
3.5.1 存储结构 55
3.5.2 索引策略 59
3.5.3 数据存储策略 65
3.5.4 存储分配优化 67
3.6 数据装载接口设计 68
习题 69
3.7 本章小结 69
第4章 数据仓库的建立和维护 71
4.1 数据仓库的投资分析 71
4.1.1 建设数据仓库的必要性 71
4.1.2 数据仓库的投资回报分析 72
4.2 数据仓库的开发方法 73
4.2.1 瀑布式开发 73
4.2.2 螺旋式开发 74
4.3 数据仓库的建立过程 74
4.3.1 需求分析 75
4.3.2 数据路线 76
4.3.3 技术路线 77
4.3.4 应用路线 81
4.3.5 数据仓库部署 87
4.4.1 数据周期 88
4.4 数据仓库的维护 88
4.3.6 运行维护 88
4.4.2 参照完整性 89
4.4.3 数据环境信息 90
4.4.4 数据备份与恢复 91
4.5 提高数据仓库性能 92
4.5.1 提高I/O性能 92
4.5.2 缩小查询范围 93
4.5.3 采取并行优化技术 93
4.5.4 选择适当的初始化参数 95
4.6 数据仓库的安全性 95
4.6.1 安全类型 96
4.6.2 安全方法 96
4.7 本章小结 100
习题 101
5.1 什么是数据集市 102
第5章 数据仓库与数据集市的关系 102
5.2 数据集市的类型 103
5.3 数据集市与数据仓库的区别 104
5.4 数据集市的特点 105
5.5 数据集市的开发方法 106
5.6 数据集市的建立 107
5.7 本章小结 108
习题 108
第6章 联机分析处理(OLAP) 109
6.1 OLAP概念 109
6.1.1 什么是OLAP 109
6.1.2 OLAP的相关基本概念 109
6.1.3 OLAP和OLTP的区别 110
6.2 OLAP的基本操作 111
6.2.1 数据切片 111
6.2.3 数据上探/下钻 113
6.2.2 数据切块 113
6.2.4 数据旋转 114
6.3 OLAP分类和体系结构 115
6.3.1 OLAP的三层客户/服务器结构 115
6.3.2 OLAP的分类 115
6.3.3 OLAP的体系结构 116
6.4 基于多维数据库的OLAP(MOLAP) 118
6.4.1 多维数据库 118
6.4.2 维的分类 119
6.4.3 多维数据库存储 121
6.5 基于关系数据库的OLAP(ROLAP) 121
6.5.1 维表和事实表 121
6.5.2 星型模型和雪花模型 125
6.5.3 星座模型和雪暴模型 127
6.5.4 ROLAP与MOLAP比较 129
6.5.5 HOLAP 131
6.6 OLAP的衡量和特性 132
6.6.1 OLAP的12准则 132
6.6.2 OLAP的简洁准则(OLAP的特性) 135
6.7 OLAP的前端展现方式 136
6.7.1 OLAP实现架构 136
6.7.2 OLAP的Web呈现方式 137
6.7.3 瘦客户机方式 137
6.7.4 OLAP的前端展现 137
6.8 OLAP的发展及展望 140
6.8.1 OLAP在应用领域的发展趋势 140
6.8.2 OLAP基于Web的应用 142
6.8.3 OLAP展望 142
6.9 本章小结 143
习题 143
7.1 在电信业的应用前景 144
第7章 数据仓库的应用前景 144
7.2 在客户服务及营销方面的应用前景 146
7.3 在银行领域的应用前景 147
7.4 在保险业的应用前景 148
7.5 在图书馆领域的应用前景 148
7.6 成功案例分析 149
7.7 本章小结 154
习题 154
第二篇 数据挖掘技术篇 155
第8章 数据挖掘介绍 155
8.1 数据挖掘概述 155
8.2 数据挖掘分类 157
8.2.1 概述 157
8.2.2 描述性挖掘 158
8.2.3 预测性挖掘 159
8.3.1 数据挖掘系统的结构 160
8.3 数据挖掘系统 160
8.3.2 数据挖掘系统的设计 161
8.3.3 数据挖掘系统的发展 163
8.4 数据预处理 164
8.4.1 概述 164
8.4.2 数据清理 165
8.4.3 数据集成 166
8.4.4 数据变换 166
8.4.5 数据归约 167
8.4.6 属性概念分层的自动生成 169
8.5 数据挖掘与数据仓库 172
8.6 数据挖掘的应用和发展 172
8.6.1 数据挖掘的应用 172
8.6.2 数据挖掘未来研究方向 174
8.7 本章小结 174
习题 175
第9章 描述性挖掘 176
9.1 特征与比较描述 176
9.1.1 特征与比较描述概述 176
9.1.2 面向属性归纳 177
9.1.3 特征与比较规则 181
9.2 关联规则挖掘 184
9.2.1 关联规则的基本概念 184
9.2.2 Apriori算法 186
9.2.3 FP-growth算法 191
9.3 聚类分析 195
9.3.1 聚类分析的基本概念 195
9.3.2 基于划分的聚类算法 201
9.3.3 基于密度的聚类算法 204
9.4 本章小结 208
习题 208
第10章 分类与预测 210
10.1 决策树分类算法 212
10.1.1 什么是决策树 212
10.1.2 决策树的建立 213
10.1.3 由决策树提取分类规则 218
10.1.4 对新对象分类 219
10.2 神经网络 219
10.2.1 前馈神经网络结构 219
10.2.2 神经网络学习 221
10.2.3 神经网络分类 225
10.3 回归分析 226
10.3.1 一元回归分析 226
10.3.2 多元回归分析 230
10.3.3 非线性回归 231
习题 233
10.4 本章小结 233
第三篇 工具及实例介绍篇 235
第11章 数据仓库工具介绍 235
11.1 数据仓库产品选择 235
11.1.1 数据仓库产品组成 235
11.1.2 数据仓库产品应具备的关键技术 236
11.1.3 数据仓库产品现状 237
11.1.4 如何选取数据仓库工具 237
11.2 常用数据仓库产品简介 238
11.2.1 Oracle 9i 238
11.2.2 NCR TeraData 239
11.2.3 IBM DB2 240
11.2.4 Informix 242
11.3 本章小结 245
习题 245
12.1 Cognos公司BI主要产品介绍 246
第12章 Cognos介绍 246
12.1.1 数据查询和即席报表生成工具 247
12.1.2 模型建立工具 252
12.1.3 在线分析处理及展现工具 257
12.2 Cognos应用例子 259
12.2.1 报表的生成 259
12.2.2 Cube的构造 265
12.3 本章小结 269
习题 269
第13章 移动通信业务数据仓库系统 271
13.1 系统介绍 271
13.1.1 系统建设的原则和目标 271
13.1.2 系统结构和功能 272
13.2 系统模型设计 274
13.2.1 概念模型设计 274
13.2.2 逻辑模型设计 279
13.2.3 物理模型设计(PDM) 283
13.3 数据装载接口设计 286
13.3.1 概述 286
13.3.2 源数据分析 286
13.3.3 ETL 287
13.4 数据仓库的维护 288
13.4.1 数据周期 288
13.4.2 参照完整性 289
13.4.3 数据备份与恢复 289
13.5 前端分析展示 292
13.5.1 概述 292
13.5.2 前端分析展示设计及实现 293
13.5.3 Demo演示 293
13.6 本章小结 297
习题 297
主要参考文献 299
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《中医骨伤科学》赵文海,张俐,温建民著 2017
- 《美国小学分级阅读 二级D 地球科学&物质科学》本书编委会 2016
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《强磁场下的基础科学问题》中国科学院编 2020
- 《小牛顿科学故事馆 进化论的故事》小牛顿科学教育公司编辑团队 2018
- 《小牛顿科学故事馆 医学的故事》小牛顿科学教育公司编辑团队 2018
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019