目录 1
第1章 数据仓库概述 1
1.1 数据仓库的定义 2
1.2 数据仓库的特征 3
1.2.1 数据仓库的基本特征 4
1.2.2 数据仓库与传统数据库的区别 4
1.3 建立数据仓库的必要性 5
1.4 数据仓库系统的体系结构 7
1.4.1 数据仓库系统的体系结构概述 7
1.4.2 数据仓库系统的组织结构 9
1.5 数据集市 12
1.5.1 数据集市的基本概念 12
1.5.2 数据集市与数据仓库 13
1.6 联机分析处理与数据挖掘 15
1.6.1 联机分析处理 15
1.6.2 数据挖掘技术 16
1.7 小结 20
第2章 数据仓库的数据建模技术 21
2.1 E-R模型 21
2.1.1 基本概念 21
2.1.2 扩展的E-R模型 22
2.2 多维模型 24
2.2.1 基本概念 24
2.2.2 星型模式和雪花模式 30
2.3 星链ER模型 33
2.3.1 链式事实主题 33
2.3.2 星链ER模型结构 35
2.3.3 星链ER建模过程 39
2.3.4 逻辑模式的建立 41
2.3.5 星链ER模型特点 44
2.4 小结 45
第3章 数据仓库管理技术 46
3.1 数据仓库管理系统 46
3.1.1 系统结构 46
3.1.2 系统主要模块 47
3.1.3 ETL工具 51
3.2 数据质量 51
3.2.1 数据质量衡量指标 52
3.2.2 脏数据分类 54
3.3 数据转换和集成 57
3.3.2 数据清洗 58
3.3.1 简单转换 58
3.3.3 数据集成 60
3.3.4 数据的概括和聚合 71
3.4 数据仓库索引技术 72
3.4.1 B树索引 72
3.4.2 位图索引 74
3.4.3 连接索引 76
3.4.4 投影索引 77
3.4.5 各种索引技术的比较 77
3.5.1 元数据的分类 78
3.5 元数据管理 78
3.5.2 元数据的发布与使用 80
3.5.3 元数据的管理 81
3.6 小结 82
第4章 数据仓库螺旋式快速开发方法 83
4.1 数据仓库系统设计与数据库系统设计的比较 83
4.2 软件开发方法分析 84
4.2.1 线性顺序模型 84
4.2.5 现有数据仓库开发方法学 85
4.2.4 组件模型 85
4.2.2 快速应用开发模型 85
4.2.3 螺旋模型 85
4.3 数据仓库螺旋式快速开发方法(DW-SRAD)概述 86
4.3.1 项目评估 87
4.3.2 需求收集 88
4.3.3 系统设计 90
4.3.4 系统实现 90
4.3.5 测试与完善 91
4.3.6 部署与培训 92
4.4 数据仓库项目中的角色 93
4.3.7 总结复审 93
4.4.1 开发方项目组 94
4.4.2 用户方项目组 95
4.4.3 项目辅助组 97
4.4.4 项目机构组织 99
4.5 小结 101
第5章 数据仓库项目实施过程 102
5.1 项目评估阶段 102
5.1.1 概述 102
5.1.2 活动和任务 103
5.2.1 概述 107
5.2 需求收集阶段 107
5.2.2 活动和任务 108
5.3 系统设计阶段 111
5.3.1 概述 111
5.3.2 活动和任务 112
5.4 系统实现阶段 116
5.4.1 概述 116
5.4.2 活动和任务 117
5.5.2 活动和任务 120
5.5.1 概述 120
5.5 测试与完善阶段 120
5.6 部署与培训阶段 122
5.6.1 概述 122
5.6.2 活动和任务 123
5.7 总结复审阶段 124
5.7.1 概述 124
5.7.2 活动和任务 125
5.8 小结 125
6.1 数据仓库的应用开发 127
6.1.1 基于数据仓库应用的体系框架 127
第6章 数据仓库的应用开发与维护优化 127
6.1.2 基于Web的数据仓库应用 131
6.1.3 基于数据仓库的OLAP应用开发 133
6.2 数据仓库的数据更新与归档 135
6.2.1 数据仓库数据的更新 135
6.2.2 数据归档 138
6.3 数据仓库的运行监视 138
6.3.1 运行监视的目的 138
6.3.2 跟踪关键节点 139
6.4.1 数据处理程序调度优化 140
6.4 数据仓库性能优化 140
6.4.2 前端应用性能优化 141
6.5 小结 143
第7章 数据仓库产品 144
7.1 SAS数据仓库产品 144
7.1.1 SAS数据仓库产品的特点 144
7.1.2 SAS数据仓库体系结构 145
7.1.3 SAS数据仓库主要工具 147
7.2 微软数据仓库产品 149
7.2.1 微软数据仓库产品的特点 149
7.2.2 微软数据仓库体系结构 150
7.2.3 微软数据仓库工具 153
7.3 Oracle数据仓库产品 156
7.3.1 Orac1e数据仓库产品的特点 156
7.3.2 Orac1e数据仓库体系结构 157
7.3.3 Orac1e数据仓库工具 158
7.4 数据仓库产品比较 161
7.4.1 数据仓库产品所提供的工具 161
7.4.2 数据仓库产品特点比较 162
7.5 数据仓库工具的选择 163
7.5.1 数据仓库产品应具备的关键技术 163
7.5.2 数据仓库工具的选择 165
7.6 小结 166
第8章 企业级数据仓库项目实施案例 167
8.1 企业级数据仓库评估和规划 167
8.1.1 企业级数据仓库评估 167
8.1.2 实施企业数据仓库的必要性和可行性分析 172
8.1.3 企业级数据仓库的设计目标 173
8.1.4 高层次主题的描述 174
8.1.5 数据仓库的基本配置结构 175
8.1.6 数据仓库的组织结构 176
8.2.1 QMDM可行性分析 178
8.2 部门数据集市构建 178
8.2.2 用户需求分析和业务过程定义 179
8.2.3 QMDM的设计 179
8.3 QMDM的实施与开发测试 188
8.4 部署与培训 188
8.5 总结与复审 189
8.6 小结 189
结束语 190
参考文献 192
A.可行性分析报告模板 197
附录:数据仓库工程主要模板 197
B.数据仓库需求调查模板 198
C.数据仓库评估报告模板 199
D.功能需求说明书模板 201
E.需求评审表模板 202
F.数据仓库详细设计书模板 203
G.系统设计评审表模板 205
H.数据仓库测试规格书模板 206
I.测试问题跟踪模板 210
J.测试总结模板 211
K.培训计划模板 212