数据仓库原理、设计与应用PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:陈京民编著
- 出 版 社:北京:中国水利水电出版社
- 出版年份:2004
- ISBN:750842042X
- 页数:296 页
目录 1
前言 1
第1章 数据仓库与数据挖掘概述 1
1.1 数据仓库的发展与展望 1
1.1.1 从传统数据库到数据仓库 1
1.1.2 数据仓库的定义与基本特性 3
1.1.3 数据仓库的未来发展 7
1.2 数据仓库的体系结构 8
1.2.1 数据仓库的概念结构 8
1.2.2 虚拟数据仓库结构 8
1.2.3 数据集市结构 9
1.2.4 单一数据仓库结构 9
1.2.5 分布式数据仓库结构 10
1.3 数据仓库的参照结构 11
1.3.1 数据仓库基本功能层 11
1.3.2 数据仓库的管理层 18
1.3.3 数据仓库的元数据管理层 19
1.3.4 数据仓库的环境支持层 20
1.4 数据挖掘技术概述 21
1.4.1 数据挖掘的发展 21
1.4.2 数据挖掘的定义 22
1.5 数据挖掘技术与工具 24
1.5.1 常用的数据挖掘技术 24
1.5.2 常用数据挖掘工具 26
1.5.3 数据挖掘工具的评价标准 28
1.5.4 常用数据挖掘工具的选择 29
1.6.1 数据挖掘与数据仓库 30
1.6 数据挖掘的应用 30
1.6.2 数据挖掘过程 31
1.6.3 数据挖掘的用户 35
第2章 数据仓库开发模型 36
2.1 数据仓库开发模型概述 36
2.2 数据仓库概念模型 37
2.2.1 概念数据模型 37
2.2.2 规范的数据模型 40
2.2.3 星型模型 41
2.2.4 雪花模型 43
2.3 数据仓库的逻辑模型 43
2.3.1 事实表模型设计 45
2.4.1 数据仓库物理模型的存储结构 47
2.4 数据仓库的物理模型 47
2.3.2 维模型设计 47
2.4.2 数据仓库物理模型的索引构建 48
2.4.3 数据仓库物理模型的优化问题 52
2.5 数据仓库的元数据模型 53
2.5.1 元数据的类型与组成 53
2.5.2 元数据在数据仓库中的作用 55
2.5.3 元数据的收集 58
2.6 数据仓库的粒度和聚集模型 59
2.6.1 数据粒度的划分 60
2.6.2 确定粒度的级别 61
2.6.3 数据仓库的聚集模型确定 62
2.6.4 聚集模型的处理 62
2.6.5 聚集模型的管理 63
3.1 数据仓库开发应用的特点 64
3.1.1 数据仓库开发应用的阶段性 64
第3章 数据仓库开发应用过程 64
3.1.2 数据仓库的螺旋式开发方法 65
3.1.3 数据仓库的开发特点 66
3.2 数据仓库的规划 67
3.2.1 选择数据仓库的实现策略 67
3.2.2 确定数据仓库的开发目标和实现范围 68
3.2.3 数据仓库的结构 70
3.2.4 数据仓库使用方案和项目规划预算 71
3.3 数据仓库的概念模型设计 72
3.3.1 概念模型的需求调查 72
3.3.2 概念模型的定义 73
3.3.3 概念模型的分析 76
3.3.4 概念模型的设计 77
3.3.5 概念模型文档与评审 79
3.4 数据仓库的逻辑模型设计 80
3.4.1 分析主题域 81
3.4.2 粒度层次和聚集的确定 82
3.4.3 确定数据分割策略 82
3.4.4 关系模型定义 83
3.4.5 数据仓库的实体定义 83
3.4.6 数据仓库的数据抽取模型 84
3.4.7 数据仓库元数据模型的建立与应用 89
3.4.8 逻辑模型的评审 90
3.5 数据仓库的物理模型设计 91
3.5.1 数据仓库设计的规范 91
3.5.2 确定数据结构的类型 92
3.5.3 数据仓库索引的创建 93
3.5.5 确定存储分配 94
3.5.4 确定数据的存放位置 94
3.5.6 数据仓库物理模型的评审 95
3.6 数据仓库的实施 96
3.6.1 数据仓库与业务处理系统接口的设计 97
3.6.2 数据仓库的创建 97
3.6.3 数据仓库的数据加载、复制与发行 98
3.6.4 数据仓库的中间件设计 99
3.6.5 数据仓库的测试 99
3.7 数据仓库的应用、支持和增强 100
3.7.1 数据仓库的用户培训及支持 100
3.7.2 数据仓库的使用方式 101
3.7.3 数据仓库使用中的数据刷新 102
3.7.4 数据仓库的增强 103
4.1.1 OLAP的发展 105
4.1.2 OLAP的特性 105
4.1 OLAP技术概述 105
第4章 OLAP技术 105
4.2 OLAP与多维分析 106
4.2.1 多维基本概念 106
4.2.2 多维分析 109
4.2.3 维的层次关系 111
4.2.4 维的类关系 111
4.2.5 OLAP与数据仓库的关系 112
4.3 OLAP的实施 113
4.4 多维OLAP与关系OLAP 114
4.4.1 多维数据库 114
4.4.2 多维数据库的数据存储 116
4.4.3 多维数据库与数据仓库 116
4.4.4 MOLAP的创建与功能 117
4.4.5 ROLAP实现的三个规则 118
4.4.6 ROLAP的多维表示方法 119
4.4.7 ROLAP的创建与功能 121
4.5 OLAP技术评价 122
4.5.1 MOLAP与ROLAP的比较 122
4.5.2 OLAP的衡量标准 124
4.5.3 OLAP服务器和工具的评价标准 126
第5章 传统数据挖掘技术 128
5.1 传统的统计分析类数据挖掘技术 128
5.1.1 统计与统计类数据挖掘技术 128
5.1.2 数据的聚集与度量技术 129
5.1.3 柱状图数据挖掘技术 129
5.1.4 线性回归数据挖掘技术 131
5.1.6 聚类数据挖掘技术 133
5.1.5 非线性回归数据挖掘技术 133
5.1.7 最近邻数据挖掘技术 140
5.2 统计分析类工具 141
5.2.1 统计类数据挖掘工具 141
5.2.2 统计类数据挖掘的商业分析 142
5.2.3 统计类数据挖掘工具的功能 142
5.2.4 统计类数据挖掘工具——SPSS 143
5.3 统计分析类工具的应用 146
5.3.1 趋势分析 146
5.3.2 时序分析 147
5.3.3 周期分析 147
5.4 统计分析类工具应用的问题 148
5.4.1 统计类数据挖掘的预处理问题 148
5.4.2 统计分析应遵循的基本原则 150
5.4.4 统计类数据挖掘的性能问题 151
5.4.3 统计分析的步骤 151
第6章 现代数据挖掘技术与发展 153
6.1 知识挖掘系统的体系结构 153
6.1.1 知识发现的定义 153
6.1.2 知识发现系统的结构 154
6.2 现代挖掘技术及应用 156
6.2.1 规则型现代挖掘技术及应用 156
6.2.2 神经网络型现代挖掘技术 161
6.2.3 遗传算法型现代挖掘技术 166
6.2.4 粗糙集型现代挖掘技术 170
6.2.5 决策树型现代挖掘技术 172
6.3 知识发现的工具与应用 175
6.3.1 知识挖掘工具的系统结构 175
6.3.2 知识挖掘工具运用中的问题 177
6.3.3 知识挖掘的价值 179
6.3.4 现代数据挖掘工具简介 180
6.4 数据挖掘技术的发展 181
6.4.1 文本挖掘 181
6.4.2 Web挖掘技术 183
6.4.3 可视化数据挖掘技术 186
6.4.4 空间数据挖掘 187
6.4.5 分布式数据挖掘 190
第7章 数据仓库的应用与管理 193
7.1 数据仓库的用户 193
7.1.1 数据仓库的用户——信息的使用者与知识的挖掘者 193
7.1.2 信息使用者的数据仓库使用方式 193
7.1.3 知识挖掘者的数据仓库使用方式 194
7.2.1 分层决策体系 195
7.2 数据仓库应用案例 195
7.2.2 数据抽样分析 197
7.2.3 发挥历史数据的经济效益 198
7.2.4 回扣分析 199
7.2.5 客户关系管理 199
7.3 数据仓库的运行技术管理 200
7.3.1 数据加载的一些问题 200
7.3.2 故障恢复管理 201
7.3.3 访问控制与安全管理 201
7.3.4 数据增长的管理 202
7.4 数据仓库的元数据管理 203
7.4.1 元数据的存储、管理与维护 203
7.4.2 元数据的用户与使用方法 204
7.4.3 元数据管理模型 206
7.5 数据仓库应用中的法律问题 208
7.5.1 数据的隐私权问题 209
7.5.2 数据隐私权的处理 209
7.6 数据仓库的成本与效益分析 211
7.6.1 数据仓库的投资回报的定量分析 211
7.6.2 数据仓库的投资回报的定性分析 212
第8章 数据仓库开发实例 214
8.1 超市销售数据仓库的规划与分析 214
8.1.1 超市销售数据仓库的需求分析 214
8.1.2 超市销售数据仓库E-R模型的构造 215
8.1.3 超市数据仓库事实表模型 216
8.1.4 超市数据仓库维表模型设计 218
8.1.5 超市数据仓库模型的关键字设计 223
8.1.6 超市数据仓库的元数据设计 225
8.2.1 数据仓库开发工具 228
8.2 数据仓库开发工具简介 228
8.2.2 SQL Server数据仓库开发应用工具 230
8.3 SQL Server的数据仓库创建 232
8.3.1 创建数据库 233
8.3.2 创建表 234
8.4 SQL Server数据仓库事实表与多维数据集的建立 235
8.4.1 Analysis Manager数据库的创建与数据源确定 235
8.4.2 SQL Server数据仓库的维创建 239
8.4.3 SQL Server的多维数据集创建 246
第9章 数据仓库应用实例 253
9.1 数据仓库的数据加载与钻取 253
9.1.1 数据仓库的数据加载 253
9.1.2 超市数据仓库系统的数据加载 256
9.1.3 多维数据集的更新 262
9.1.4 数据仓库的钻取访问 267
9.1.5 数据仓库的多维表达式MDX应用 270
9.2 数据挖掘模型的设计 272
9.2.1 数据挖掘对象的分析 272
9.2.2 数据挖掘模型与相关数据的准备 273
9.2.3 数据挖掘模型的应用 276
9.3 SQL Server中的数据挖掘工具 276
9.3.1 决策类数据挖掘工具的应用 277
9.3.2 聚类分析数据挖掘工具的应用 282
9.4 数据仓库客户端界面的设计 287
9.4.1 客户端界面展现内容的设计 287
9.4.2 客户端界面展现工具的选择 288
9.4.3 Excel展现界面的实现 289
参考文献 294
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《虚拟流域环境理论技术研究与应用》冶运涛蒋云钟梁犁丽曹引等编著 2019
- 《当代翻译美学的理论诠释与应用解读》宁建庚著 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《计算机组成原理解题参考 第7版》张基温 2017
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中央财政支持提升专业服务产业发展能力项目水利工程专业课程建设成果 设施农业工程技术》赵英编 2018
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《清至民国中国西北戏剧经典唱段汇辑 第8卷》孔令纪 2018