《数据仓库》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:(美)W.H.Inmon著;王志海,林友芳等译
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2003
  • ISBN:7111116348
  • 页数:271 页
图书介绍:本书详尽地讲述了数据仓库的概念和原理,以及建立数据仓库的方法和过程。

第1章 决策支持系统的发展 1

1.1 演化 1

1.1.1 主文件 1

1.1.2 直接存取存储设备的出现 3

1.1.3 个人计算机/第四代编程语言技术 3

1.1.4 进入抽取程序 3

1.1.5 蜘蛛网 4

1.2 自然演化式体系结构的问题 4

1.2.1 数据缺乏可信性 5

1.2.2 生产率问题 8

1.2.3 从数据到信息 9

1.2.4 方法的变迁 11

1.3 体系结构化环境 12

1.3.1 体系结构化环境的层次 12

1.3.2 体系结构化环境中的数据集成 14

1.4 用户是谁 15

1.5 开发生命周期 15

1.6 硬件利用模式 16

1.7 为重建工程创造条件 17

1.8 监控数据仓库环境 18

1.9 小结 20

第2章 数据仓库环境 21

2.2 面向主题 24

2.1 数据仓库的结构 24

2.3 第1天到第n天的现象 28

2.4 粒度 29

2.4.1 粒度带来的好处 30

2.4.2 粒度的一个例子 31

2.4.3 双重粒度 34

2.5 探查与数据挖掘 36

2.6 活样本数据库 36

2.7 分区设计方法 38

2.8 数据仓库中的数据组织 40

2.9 数据仓库:标准手册 43

2.10 审计与数据仓库 44

2.11 成本合理性分析 45

2.12 数据的同构/异构 48

2.13 数据仓库中的数据清理 50

2.14 报表与体系结构化环境 50

2.15 各种环境中的操作型窗口 51

2.16 数据仓库中的错误数据 52

2.17 小结 53

第3章 设计数据仓库 55

3.1 从操作型数据开始 55

3.2 数据/过程模型与体系结构化环境 59

3.3 数据仓库与数据模型 60

3.3.1 数据仓库的数据模型 62

3.3.2 中间层数据模型 63

3.3.3 物理数据模型 67

3.4 数据模型与迭代式开发 70

3.5 规范化/反规范化 71

3.6 数据仓库中的快照 75

3.7 元数据 77

3.8 数据仓库中的参照表管理 78

3.9 数据周期——时间间隔 79

3.10 转换和集成的复杂性 81

3.11.2 快照的构成 84

3.11.3 一些例子 84

3.11 数据仓库记录的触发 84

3.11.1 事件 84

3.12 简要记录 85

3.13 管理大量数据 86

3.14 创建多个简要记录 87

3.15 从数据仓库环境到操作型环境 87

3.16 数据仓库数据的直接访问 88

3.17 数据仓库数据的间接访问 88

3.17.1 航空公司的佣金计算系统 89

3.17.2 零售个性化系统 89

3.17.3 信用审核 91

3.18 数据仓库数据的间接使用 93

3.19 星型连接 93

3.20 支持ODS 98

3.21 小结 99

第4章 数据仓库中的粒度 100

4.1 粗略估算 100

4.2 粒度设计过程的输入 101

4.3 溢出存储器中的数据 102

4.4 确定粒度级别 105

4.5 一些反馈循环技巧 106

4.6 银行环境中的粒度级别 107

4.7 制造业环境中的粒度级别 108

4.8 保险业环境中的粒度级别 111

4.9 小结 113

第5章 数据仓库和技术 114

5.1 管理大量数据 114

5.2 管理多种介质 115

5.3 索引/监控数据 115

5.4 多种技术的接口 116

5.5 程序员/设计者对数据存放位置的控制 116

5.6 数据的并行存储/管理 117

5.7 元数据管理 117

5.8 语言接口 117

5.9 数据的有效装载 118

5.10 有效利用索引 119

5.11 数据压缩 119

5.12 复合主键 119

5.13 变长数据 119

5.14 加锁管理 120

5.15 只涉及索引的处理 120

5.16 快速恢复 121

5.17 其他的技术特征 121

5.18 DBMS类型和数据仓库 121

5.20 多维DBMS和数据仓库 123

5.19 改变DBMS技术 123

5.21 在多种存储介质上的构建数据仓库 128

5.22 数据仓库环境中的元数据 128

5.23 上下文和内容 130

5.24 上下文信息的三种类型 130

5.25 捕获和管理上下文信息 132

5.26 刷新数据仓库 132

5.27 测试问题 134

5.28 小结 134

第6章 分布式数据仓库 136

6.1 分布多数据仓库的类型 136

6.1.1 局部数据仓库和全局数据仓库 138

6.1.2 技术分布式数据仓库 148

6.1.3 独立开发的分布式数据仓库 150

6.2 开发项目的本质特征 150

6.3 分布式数据仓库的开发 152

6.3.1 在分布的地理位置间协调开发 153

6.3.2 企业数据的分布式模型 154

6.3.3 分布式数据仓库中的元数据 156

6.4 在多种层次上构建数据仓库 156

6.5 多个小组建立当前细节数 158

6.5.1 不同层的不同需求 160

6.5.2 其他类型的细节数据 162

6.5.3 元数据 163

6.6 公共细节数据采用多种平台 164

6.7 小结 165

第7章 主管信息系统和数据仓库 166

7.1 EIS的目标 166

7.2 一个简单例子 166

7.3 向下钻取分析 168

7.4 支持向下钻取处理 170

7.5 作为EIS基础的数据仓库 170

7.6 到哪里取数据 172

7.7 事件映射 174

7.8 细节数据和EIS 175

7.10 小结 176

7.9 在EIS中只保存汇总数据 176

第8章 外部数据/非结构化数据与数据仓库 177

8.1 数据仓库中的外部数据/非结构化数据 178

8.2 元数据和外部数据 179

8.3 存储外部数据/非结构化数据 181

8.4 外部数据/非结构化数据的不同部件 182

8.5 建模与外部数据/非结构化数据 182

8.6 辅助报告 183

8.7 外部数据归档 183

8.8 内部数据与外部数据的比较 183

8.9 小结 184

9.1 一种迁移方案 185

第9章 迁移到体系结构化环境 185

9.2 反馈循环 191

9.3 策略方面的考虑 192

9.4 方法和迁移 194

9.5 一种数据驱动的开发方法学 194

9.6 数据驱动的方法 196

9.7 系统开发生命周期 196

9.8 一个哲学上的考虑 196

9.9 操作型开发/DSS开发 196

9.10 小结 197

第10章 数据仓库和Web 198

10.1 支持电子商务环境 204

10.2 将数据从Web移动到数据仓库 205

10.3 将数据从数据仓库移动到Web 205

10.4 对Web的支持 206

10.5 小结 206

第11章 ERP和数据仓库 207

11.1 数据仓库之外的ERP应用系统 207

11.2 建造在ERP内部的数据仓库 208

11.3 通过ERP和非ERP系统为数据仓库提供数据 209

11.4 面向ERP的企业数据仓库 212

11.5 小结 213

第12章 数据仓库的设计复查要目 214

12.1 进行设计复查所涉及的问题 215

12.1.1 何时进行设计复查 215

12.1.2 谁负责设计复查 215

12.1.3 有哪些议事日程 215

12.1.4 结果 215

12.1.5 复查管理 215

12.1.6 典型的数据仓库设计复查 216

12.2 小结 227

附录 228

技术词汇 257

参考文献 265