当前位置:首页 > 工业技术
数据仓库设计
数据仓库设计

数据仓库设计PDF电子书下载

工业技术

  • 电子书积分:12 积分如何计算积分?
  • 作 者:(美)Claudia Imhoff,(美)Nicholas Galemmo,(美)Jonathan G.Geiger著;于戈,鲍玉斌,王大玲译
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2005
  • ISBN:7111139631
  • 页数:312 页
图书介绍:本书全面论述了设计有效数据仓库的方法。
《数据仓库设计》目录

译者序 2

第一部分 基本概念 2

第1章 绪论 2

1.1 业务智能概述 2

目录 2

1.2 什么是数据仓库 7

1.2.1 数据仓库的作用和用途 7

1.2.2 企业信息工厂 8

1.3 数据仓库的多用途性 12

1.3.1 支持的数据集市类型 13

1.3.2 支持的BI技术类型 14

1.4 可维护的数据仓库环境的特点 14

1.5 数据仓库数据模型 16

1.5.3 一致性 17

1.5.1 非冗余性 17

1.5.2 稳定性 17

1.5.4 最终数据使用方面的灵活性 18

1.5.5 Codd和Date前提 18

1.6 建立数据集市的效果 19

1.7 小结 20

第2章 关系的基本概念 21

2.1 为什么需要数据模型 21

2.2 关系数据模型的建模对象 22

2.2.1 主题 22

2.2.2 实体 22

2.2.3 元素或属性 23

2.2.4 联系 24

2.3 数据模型的类型 25

2.3.1 主题域模型 26

2.3.2 业务数据模型 28

2.3.3 系统模型 31

2.3.4 技术模型 31

2.4 关系数据建模指南 32

2.4.1 指导方针与最合适的做法 33

2.4.2 规范化 34

2.5 关系数据模型的规范化 35

2.5.1 第1范式 35

2.5.2 第2范式 36

2.5.3 第3范式 36

2.5.4 其他规范化级别 38

2.6 小结 38

3.1 业务场景 42

第二部分 模型开发 42

第3章 理解业务模型 42

3.2 主题域模型 45

3.2.1 关于特定行业的考虑 47

3.2.2 主题域模型开发过程 48

3.2.3 Zenith汽车公司的主题域模型 57

3.3 业务数据模型 59

3.4 小结 68

第4章 模型开发 69

4.1 方法学 69

4.1.1 步骤1:选择感兴趣的数据 70

4.1.2 步骤2:在键中增加时间 79

4.1.3 步骤3:增加派生数据 85

4.1.4 步骤4:确定粒度级别 87

4.1.5 步骤5:汇总数据 89

4.1.6 步骤6:合并实体 93

4.1.7 步骤7:建立数组 95

4.1.8 步骤8:分离数据 96

4.2 小结 96

第5章 键的建立和维护 98

5.1 业务背景 98

5.1.1 不一致的客户业务定义 99

5.1.2 不一致的客户系统定义 100

5.1.3 系统之间不一致的客户标识 100

5.1.4 包含外部数据 102

5.1.5 由角色唯一确定的客户 103

5.1.6 未加说明的客户层次结构 103

5.2 数据仓库系统模型 104

5.2.2 不一致的客户系统定义 105

5.2.1 不一致的客户业务定义 105

5.2.3 系统之间不一致的客户标识 106

5.2.4 吸收外部数据 106

5.2.5 由角色唯一确定的客户 107

5.2.6 未加说明的客户层次结构 107

5.3 数据仓库技术模型 107

5.3.1 来自现存系统的键 107

5.3.2 来自公认标准的键 109

5.3.3 代理键 109

5.4 多维数据集市的含义 111

5.4.1 多维模型中的差异 111

5.4.2 多维一致性的维护 112

5.5 小结 113

6.1 业务中的日历 114

第6章 日历建模 114

6.1.1 日历类型 115

6.1.2 其他财务日历 118

6.1.3 日历的元素 120

6.1.4 历时间跨度 122

6.2  时间和数据仓库 123

6.2.1 时间的性质 123

6.2.2 时间的标准化 123

6.3 数据仓库系统模型 125

6.4 案例分析:简单财务日历 126

6.4.1 分析 127

6.4.2 一个简单日历模型 128

6.5.1 分析 132

6.5.2 GOSH日历模型 132

6.5 案例分析:位置有关日历 132

6.5.3 日历交付 133

6.6 案例分析:多语种日历 135

6.6.1 分析 135

6.6.2 多国语言的存储 135

6.6.3 不同日期表示格式的处理 135

6.6.4 多语种交付 138

6.7 案例分析:多重财务日历 139

6.7.1 分析 140

6.7.2 扩展日历 140

6.8 案例分析:季节日历 140

6.8.1 分析 142

6.802 季 节日历的结构 142

6.8.3 季节数据交付 143

6.9 小结 143

7.1 业务中的层次树 145

第7章 层次树建模 145

7.2 层次树的性质 146

7.2.1 层次树的深度 147

7.2.2 层次树的父子关系 148

7.2.3 层次树的结构 149

7.2.4 历史 150

7.2.5 层次树类型小结 150

7.3 案例分析:零售层次树 152

7.3.1 层次树的分析 152

7.3.2 层次树的实现 153

7.4 案例分析:销售和产量计划安排 155

7.4.1分析 157

7.4.2 产品层次树 159

7.4.3 客户层次树 165

7.5 案例分析:零售采购 173

7.5.1 分析 175

7.5.2 业务模型的实现 175

7.6 案例分析:套装 181

7.6.1 分析 182

7.6.2 材料清单的加入 183

7.6.3 数据的发布 184

7.7 结构的变换 184

7.7.1 递归树的构建 185

7.7.2 递归树的平面化 185

7.8 小结 187

第8章 事务建模 188

8.1 业务型事务 188

8.1.1 数据仓库的业务应用 188

8.2 应用接口 191

8.1.3 涉及变化的业务规则 191

8.1.2 每个事务的平均行数 191

8.2.1 快照接口 192

8.2.2 增量接口 193

8.2.3 数据库事务日志 194

8.3 事务数据的交付 195

8.4 案例分析:销售订单快照 196

8.4.1 订单的变换 199

8.4.2 技术1:完全快照捕捉 201

8.4.3 技术2:变化快照捕捉 203

8.4.4 技术3:具有增量捕捉的变化快照 209

8.4.5 装载处理 211

8.5 案例分析:事务接口 212

8.5.1 事务的建模 213

8.5.2 事务的处理 214

8.6  小结 216

第9章 数据仓库优化 217

9.1 发过程的优化 217

9.1.1 设计和分析的优化 217

9.1.2 应用开发的优化 217

9.2 数据库的优化 219

9.2.1 数据聚簇 219

9.2.2 表划分 220

9.2.3 实施参照完整性 226

9.2.4 按索引组织的表 228

9.2.5 索引技术 229

9.2.6 小结 234

9.3 系统模型的优化 235

9.3.1 垂直划分 235

9.3. 3子类型聚簇 239

9.3.2 逆规范化 239

9.4  小结 241

第三部分 操作和管理 244

第10章对业务变化的适应 244

10. 1数据仓库的变化 244

10.1.1 变化的缘由 244

10.1.2 对变化的控制 245

10.1.3 变化的实现 246

10.2 业务变化的建模 247

10.2.1 设想最坏的情况 248

10.2.2 对联系的概化 248

10.2.3 使用代理键 250

10.3 业务变化的实现 252

10.3.1 主题域的集成 253

10.3.2 增加主题域 255

10.4 小结 256

第11章 模型维护 257

11.1 模型及其演进的管理 257

11.1.1 主题域模型 257

11.1.2 业务数据模型 258

11.1.3 系统数据模型 259

11.1.4 技术数据模型 260

11.1.5 同步的含义 261

11.2 模型的协调 261

11.2.1 主题域和业务数据模型 262

11.2.2 业务数据模型和系统数据模型 265

11.2.3 系统数据模型和技术数据模型 267

11.3 对多个建模师的管理 268

11.3.1 作用和职责 268

11.3.2 冲突管理 269

11.4 小结 270

第12章 关系型解决方案的部署 272

12.1 数据集市的混乱 272

12.1.1 为什么糟糕 274

12.1.2 “体系结构方式”准则 276

12.2 从数据集市混乱结构中迁移出来 278

12.2.1 维的一致化 278

12.2.2 建立数据仓库数据模型 280

12.2.3 建立数据仓库 282

12.2.4 仅仅以“体系结构方式”建立新的数据集市——不理会旧的集市 284

12.2.5 从一个数据集市建立体系结构 285

12.3 选择正确的迁移路径 287

12.4 小结 288

13.1 多维体系结构 289

第13章 数据仓库设计方法学比较 289

13.2 企业信息工厂体系结构 292

13.3 CIF体系结构和MD体系结构的比较 293

13.3.1 范围 293

13.3.2 角度 294

13.3.3 数据流 295

13.3.4 易失性 296

13.3.5 灵活性 297

13.3.6 复杂性 297

13.3.7 功能性 298

13.3.8 持续的维护 298

13.4 小结 298

术语表 301

参考文献 311

相关图书
作者其它书籍
返回顶部