《数据仓库工具箱:维度建模的完全指南 (第二版)》PDF下载

  • 购买积分:13 如何计算积分?
  • 作  者:(美)金博尔(Kimball,R.)著 谭明金译
  • 出 版 社:电子工业出版社
  • 出版年份:2003
  • ISBN:
  • 页数:395 页
图书介绍:

目录 1

第1章 维度建模初步 1

1.1 信息应用的不同领域 1

1.2 数据仓库的最终目标 2

1.2.1 出版业方面的比喻实例 4

1.3 数据仓库的组成 6

1.3.1 操作型源系统 7

1.3.2 数据聚集环节 7

1.3.3 数据展示 9

1.3.4 数据存取工具 12

1.3.5 其他要考虑的内容 13

1.4 维度建模词汇表 15

1.4.1 事实表 15

1.4.2 维度表 18

1.4.3 事实与维度的融合 20

1.5 关于维度建模的神话 22

1.5.1 应该避免的常见疏误 24

1.6 总结 25

第2章 零售营销 26

2.1 四步维度设计过程 27

2.2 零售实例的研究 28

2.2.1 第一步:选取业务处理 30

2.2.2 第二步:定义粒度 30

2.2.3 第三步:选定维度 31

2.2.4 第四步:确定事实 32

2.3 维度表属性 34

2.3.1 日期维度 35

2.3.2 产品维度 39

2.3.3 商场维度 42

2.3.4 促销维度 43

2.3.5 退化的事务编号维度 46

2.4 零售方案的运用 48

2.5 零售方案的扩展 49

2.6.1 维度的规范化处理(雪花处理) 52

2.6 经受住安逸诱惑的考验 52

2.6.2 维度使用过多 54

2.7 代理关键字 56

2.8 市场篮子分析 59

2.9 总结 62

第3章 库存 63

3.1 值链的引入 63

3.2 库存模型 64

3.2.1 周期库存快照 65

3.2.2 库存事务 69

3.2.3 库存累积快照 70

3.3 值链的集成 72

3.4 数据仓库总线结构 73

3.4.1 数据仓库总线矩阵 75

3.4.2 一致性维度 78

3.4.3 一致性事实 82

3.5 总结 83

4.1 采购案例研究 84

第4章 采购 84

4.2 采购事务 85

4.2.1 多事务事实表与单事务事实表 86

4.2.2 辅助性采购快照 89

4.3 渐变维度 89

4.3.1 类型1:改写属性值 90

4.3.2 类型2:添加维度行 91

4.3.3 类型3:添加维度列 94

4.4 混合渐变维度处理方法 96

4.4.1 可预见的多重变化 96

4.4.2 不可预见的单重变化 97

4.5 快变维度 98

4.6 总结 99

第5章 订单管理 100

5.1 订单管理的引入 101

5.2 订单事务 101

5.2.1 事实的规范化 102

5.2.2 维度的角色模仿 103

5.2.3 再谈产品维度 104

5.2.4 收货顾客维度 106

5.2.5 交易维度 108

5.2.6 订单编号退化维度 109

5.2.7 杂项维度 110

5.2.8 多种流通货币 112

5.2.9 粒度不同的标题与分列项事实 113

5.2.1 0发票事务 115

5.2.1 1赢利与亏损事实 116

5.2.1 2利润率:最有效能的数据中心 118

5.2.1 3利润率方面的告诫 119

5.2.1 4顾客满意度事实 119

5.3 订单任务流水线累积快照 120

5.3.1 延迟计算 122

5.3.2 多个计量单位 123

5.3.3 后视图镜像 124

5.4 事实表的比较 125

5.4.1 事务事实表 125

5.4.2 周期快照事实表 126

5.4.3 累积快照事实表 126

5.5 实时分区的设计 127

5.5.1 实时分区的条件 128

5.5.2 事务粒度的实时分区 128

5.5.3 周期快照的实时分区 129

5.5.4 累积快照的实时分区 130

5.6 总结 131

第6章 客户关系管理 132

6.1 CRM概述 133

6.1.1 操作型与分析型CRM 134

6.1.2 CRM封装组件 136

6.2 客户维度 136

6.2.1 姓名与地址解析 137

6.2.2 常见的其他客户属性 141

6.2.3 低基数属性集的维度支架 143

6.2.4 大型变化客户维度 144

6.2.5 类型2客户维度变化的内容 150

6.2.6 客户行为研究组 150

6.2.7 商务客户体系结构 152

6.2.8 多源客户数据的组合 158

6.3 多业务处理的客户数据分析 159

6.4 总结 160

第7章 账目 162

7.1 账目案例研究 162

7.2 一般分类总账方面的数据 163

7.2.1 一般分类总账周期快照 164

7.2.2 一般分类总账日记账分录事务 166

7.2.3 财务报表 169

7.3 预算处理 169

7.3.1 合并事实表 172

7.4 OLAP与封装分析型方案的角色 174

7.5 总结 175

第8章 人力资源管理 176

8.1 维度中时间标记事务的跟踪 176

8.1.1 具有周期快照事实的时间标记维度 180

8.2 审计维度 181

8.3 关键词支架维度 183

8.3.1 选择AND与OR方面的难题 184

8.3.2 搜索子字符串 184

8.4 调查表数据 186

8.5 总结 187

第9章 财经服务 188

9.1 银行业案例研究 188

9.2 维度精选 189

9.2.1 家庭维度 192

9.2.2 多值维度 193

9.2.3 再谈微型维度 194

9.3 事实的自由值分段 195

9.4 时间点结余 197

9.5 异构产品方案 199

9.5.1 事务事实异构产品 203

9.6 总结 203

第10章 电信与公用事业 205

10.1 电信实例研究 205

10.2 设计复查要考虑的一般因素 208

10.2.1 粒度 208

10.2.2 日期维度 209

10.2.3 退化维度 210

10.2.4 维度解释与描述 210

10.2.5 代理关键字 211

10.2.6 维度太多(或者太少) 211

10.3 草案设计活动的讨论 211

10.4 地理位置维度 213

10.4.2 支撑地理信息系统 214

10.4.1 位置支架 214

10.4 总结 215

第11章 交通 216

11.1 飞机常客实例研究 216

11.1.1 多个事实表粒度 217

11.1.2 航段与行程的连接 219

11.2 向其他行业的扩展 221

11.2.1 载运货主 221

11.2.2 旅行社 222

11.3 将微型维度组合成超级维度 223

11.3.1 服务等级 223

11.3.2 起点与目的地 224

11.4 日期与时间方面更多的考虑 226

11.4.1 国别历法 226

11.4.2 作为维度或者事实的日间时间 227

11.4.3 处于多个时区的日期与时间 228

11.5 总结 229

12.1 大学实例研究 230

第12章 教育 230

12.2 用于维度跟踪的累积快照 231

12.3 非事实型事实表 233

12.3.1 学生注册事件 234

12.3.2 设施应用范围 236

12.3.3 学生听课事件 237

12.4 其他领域的分析兴趣 240

12.5 总结 241

第13章 卫生保健 242

13.1 卫生保健值环 242

13.2 卫生保健单据 245

13.2.1 日期维度所模仿的角色 248

13.2.2 多值诊断维度 249

13.2.3 扩展单据事实表以显示利润 252

13.2.4 住院出单维度 253

13.3 复杂卫生保健事件 254

13.4.1 用于稀疏事实的事实维度 255

13.4 医药记录 255

13.5 内容回顾 257

13.5.1 迟到事实行 258

13.5.2 迟到维度行 259

13.6 总结 260

第14章 电子商务 261

14.1 Web客户-服务器交互指南 262

14.2 为什么点击流并不仅仅是另外一种数据源 264

14.2.1 跟踪点击流数据所遇到的挑战 265

14.2.2 用于点击流的具体维度 270

14.3 用于整个会话的点击流事实表 275

14.4 用于单个页面事件的点击流事实表 278

14.5 聚集点击流事实表 281

14.6 将点击流数据中心集成到企业数据仓库 282

14.7 商务利润率数据中心 284

14.8 总结 287

第15章 保险 289

15.1 保险实例研究 290

15.1.1 保险值链 291

15.1.2 草拟的保险总线矩阵 292

15.2 保单事务 293

15.2.1 维度细节与方法 293

15.2.2 可选(或者补充)保单累积快照 299

15.3 保单周期快照 299

15.3.1 一致性维度 299

15.3.2 一致性事实 300

15.3.3 再谈异构产品 301

15.4 更多的保险实例研究背景 302

15.3.4 再谈多值维度 302

15.4.1 更新的保险总线矩阵 303

15.5 索赔事务 304

15.6 索赔累积快照 306

15.7 保险/索赔合并快照 308

15.8 非事实型事故事件 309

15.9 维度建模要避免的常见错误 310

15.1 0总结 313

第16章 建立数据仓库 314

16.1.1 路线图的主要兴趣点 315

16.1 业务维度生命周期路线图 315

16.2 项目规划与管理 317

16.2.1 准备情况的评估 317

16.2.2 范围的确定 319

16.2.3 论证 319

16.2.4 人力资源配备 319

16.2.5 项目方案的开发与维护 322

16.3.1 需求规划 323

16.3 业务需求定义 323

16.3.2 业务需求收集 325

16.3.3 文档形成与后续整理 327

16.4 生命周期技术路径 329

16.5 技术体系设计 329

16.5.1 创建技术体系的8步过程 330

16.6 产品选购与安装 332

16.8 维度建模 334

16.7 生命周期数据路径 334

16.9 物理设计 336

16.9.1 聚集策略 336

16.9.2 初始索引策略 337

16.10 数据转储系统的设计与开发 338

16.10.1 维度表转储处理 339

16.10.2 事实表转储 341

16.11 生命周期分析型应用路径 342

16.11.1 分析型应用程序说明 343

16.11.2 分析型应用程序的开发 343

16.12 配发 344

16.13 维护与扩展 345

16.14 建立数据仓库需要避免的常见错误 347

16.15 总结 349

第17章 相关知识与展望 350

17.1 正在出现的技术进步 351

17.2 安全需求与隐私影响方面的政治压力 353

17.2.1 有益的使用与具有险恶用心的滥用之间存在冲突 354

17.2.2 由谁掌握个人数据 355

17.2.3 可能发生什么事情 355

17.2.4 监视监控人员如何影响数据仓库的体系 356

17.3 精心设计而避免出现灾难性的失败 358

17.3.1 灾难性故障 358

17.3.2 对灾难性故障的应对 359

17.4 知识产权与公平使用 361

17.5 数据仓库应用方面的文化取向 362

17.5.1 企业范围内的数字管理 362

17.5.2 对复杂的关键性能指标存在更多的信赖 363

17.5.3 行为是新的应用大户 363

17.5.4 封装应用达到顶峰 364

17.5.5 仍然需要应用集成 364

17.5.6 采购数据仓库需要进行审慎的风险评估 365

17.6 结束语 366

术语表 367