目录 1
第1章 维度建模初步 1
1.1 信息应用的不同领域 1
1.2 数据仓库的最终目标 2
1.2.1 出版业方面的比喻实例 4
1.3 数据仓库的组成 6
1.3.1 操作型源系统 7
1.3.2 数据聚集环节 7
1.3.3 数据展示 9
1.3.4 数据存取工具 12
1.3.5 其他要考虑的内容 13
1.4 维度建模词汇表 15
1.4.1 事实表 15
1.4.2 维度表 18
1.4.3 事实与维度的融合 20
1.5 关于维度建模的神话 22
1.5.1 应该避免的常见疏误 24
1.6 总结 25
第2章 零售营销 26
2.1 四步维度设计过程 27
2.2 零售实例的研究 28
2.2.1 第一步:选取业务处理 30
2.2.2 第二步:定义粒度 30
2.2.3 第三步:选定维度 31
2.2.4 第四步:确定事实 32
2.3 维度表属性 34
2.3.1 日期维度 35
2.3.2 产品维度 39
2.3.3 商场维度 42
2.3.4 促销维度 43
2.3.5 退化的事务编号维度 46
2.4 零售方案的运用 48
2.5 零售方案的扩展 49
2.6.1 维度的规范化处理(雪花处理) 52
2.6 经受住安逸诱惑的考验 52
2.6.2 维度使用过多 54
2.7 代理关键字 56
2.8 市场篮子分析 59
2.9 总结 62
第3章 库存 63
3.1 值链的引入 63
3.2 库存模型 64
3.2.1 周期库存快照 65
3.2.2 库存事务 69
3.2.3 库存累积快照 70
3.3 值链的集成 72
3.4 数据仓库总线结构 73
3.4.1 数据仓库总线矩阵 75
3.4.2 一致性维度 78
3.4.3 一致性事实 82
3.5 总结 83
4.1 采购案例研究 84
第4章 采购 84
4.2 采购事务 85
4.2.1 多事务事实表与单事务事实表 86
4.2.2 辅助性采购快照 89
4.3 渐变维度 89
4.3.1 类型1:改写属性值 90
4.3.2 类型2:添加维度行 91
4.3.3 类型3:添加维度列 94
4.4 混合渐变维度处理方法 96
4.4.1 可预见的多重变化 96
4.4.2 不可预见的单重变化 97
4.5 快变维度 98
4.6 总结 99
第5章 订单管理 100
5.1 订单管理的引入 101
5.2 订单事务 101
5.2.1 事实的规范化 102
5.2.2 维度的角色模仿 103
5.2.3 再谈产品维度 104
5.2.4 收货顾客维度 106
5.2.5 交易维度 108
5.2.6 订单编号退化维度 109
5.2.7 杂项维度 110
5.2.8 多种流通货币 112
5.2.9 粒度不同的标题与分列项事实 113
5.2.1 0发票事务 115
5.2.1 1赢利与亏损事实 116
5.2.1 2利润率:最有效能的数据中心 118
5.2.1 3利润率方面的告诫 119
5.2.1 4顾客满意度事实 119
5.3 订单任务流水线累积快照 120
5.3.1 延迟计算 122
5.3.2 多个计量单位 123
5.3.3 后视图镜像 124
5.4 事实表的比较 125
5.4.1 事务事实表 125
5.4.2 周期快照事实表 126
5.4.3 累积快照事实表 126
5.5 实时分区的设计 127
5.5.1 实时分区的条件 128
5.5.2 事务粒度的实时分区 128
5.5.3 周期快照的实时分区 129
5.5.4 累积快照的实时分区 130
5.6 总结 131
第6章 客户关系管理 132
6.1 CRM概述 133
6.1.1 操作型与分析型CRM 134
6.1.2 CRM封装组件 136
6.2 客户维度 136
6.2.1 姓名与地址解析 137
6.2.2 常见的其他客户属性 141
6.2.3 低基数属性集的维度支架 143
6.2.4 大型变化客户维度 144
6.2.5 类型2客户维度变化的内容 150
6.2.6 客户行为研究组 150
6.2.7 商务客户体系结构 152
6.2.8 多源客户数据的组合 158
6.3 多业务处理的客户数据分析 159
6.4 总结 160
第7章 账目 162
7.1 账目案例研究 162
7.2 一般分类总账方面的数据 163
7.2.1 一般分类总账周期快照 164
7.2.2 一般分类总账日记账分录事务 166
7.2.3 财务报表 169
7.3 预算处理 169
7.3.1 合并事实表 172
7.4 OLAP与封装分析型方案的角色 174
7.5 总结 175
第8章 人力资源管理 176
8.1 维度中时间标记事务的跟踪 176
8.1.1 具有周期快照事实的时间标记维度 180
8.2 审计维度 181
8.3 关键词支架维度 183
8.3.1 选择AND与OR方面的难题 184
8.3.2 搜索子字符串 184
8.4 调查表数据 186
8.5 总结 187
第9章 财经服务 188
9.1 银行业案例研究 188
9.2 维度精选 189
9.2.1 家庭维度 192
9.2.2 多值维度 193
9.2.3 再谈微型维度 194
9.3 事实的自由值分段 195
9.4 时间点结余 197
9.5 异构产品方案 199
9.5.1 事务事实异构产品 203
9.6 总结 203
第10章 电信与公用事业 205
10.1 电信实例研究 205
10.2 设计复查要考虑的一般因素 208
10.2.1 粒度 208
10.2.2 日期维度 209
10.2.3 退化维度 210
10.2.4 维度解释与描述 210
10.2.5 代理关键字 211
10.2.6 维度太多(或者太少) 211
10.3 草案设计活动的讨论 211
10.4 地理位置维度 213
10.4.2 支撑地理信息系统 214
10.4.1 位置支架 214
10.4 总结 215
第11章 交通 216
11.1 飞机常客实例研究 216
11.1.1 多个事实表粒度 217
11.1.2 航段与行程的连接 219
11.2 向其他行业的扩展 221
11.2.1 载运货主 221
11.2.2 旅行社 222
11.3 将微型维度组合成超级维度 223
11.3.1 服务等级 223
11.3.2 起点与目的地 224
11.4 日期与时间方面更多的考虑 226
11.4.1 国别历法 226
11.4.2 作为维度或者事实的日间时间 227
11.4.3 处于多个时区的日期与时间 228
11.5 总结 229
12.1 大学实例研究 230
第12章 教育 230
12.2 用于维度跟踪的累积快照 231
12.3 非事实型事实表 233
12.3.1 学生注册事件 234
12.3.2 设施应用范围 236
12.3.3 学生听课事件 237
12.4 其他领域的分析兴趣 240
12.5 总结 241
第13章 卫生保健 242
13.1 卫生保健值环 242
13.2 卫生保健单据 245
13.2.1 日期维度所模仿的角色 248
13.2.2 多值诊断维度 249
13.2.3 扩展单据事实表以显示利润 252
13.2.4 住院出单维度 253
13.3 复杂卫生保健事件 254
13.4.1 用于稀疏事实的事实维度 255
13.4 医药记录 255
13.5 内容回顾 257
13.5.1 迟到事实行 258
13.5.2 迟到维度行 259
13.6 总结 260
第14章 电子商务 261
14.1 Web客户-服务器交互指南 262
14.2 为什么点击流并不仅仅是另外一种数据源 264
14.2.1 跟踪点击流数据所遇到的挑战 265
14.2.2 用于点击流的具体维度 270
14.3 用于整个会话的点击流事实表 275
14.4 用于单个页面事件的点击流事实表 278
14.5 聚集点击流事实表 281
14.6 将点击流数据中心集成到企业数据仓库 282
14.7 商务利润率数据中心 284
14.8 总结 287
第15章 保险 289
15.1 保险实例研究 290
15.1.1 保险值链 291
15.1.2 草拟的保险总线矩阵 292
15.2 保单事务 293
15.2.1 维度细节与方法 293
15.2.2 可选(或者补充)保单累积快照 299
15.3 保单周期快照 299
15.3.1 一致性维度 299
15.3.2 一致性事实 300
15.3.3 再谈异构产品 301
15.4 更多的保险实例研究背景 302
15.3.4 再谈多值维度 302
15.4.1 更新的保险总线矩阵 303
15.5 索赔事务 304
15.6 索赔累积快照 306
15.7 保险/索赔合并快照 308
15.8 非事实型事故事件 309
15.9 维度建模要避免的常见错误 310
15.1 0总结 313
第16章 建立数据仓库 314
16.1.1 路线图的主要兴趣点 315
16.1 业务维度生命周期路线图 315
16.2 项目规划与管理 317
16.2.1 准备情况的评估 317
16.2.2 范围的确定 319
16.2.3 论证 319
16.2.4 人力资源配备 319
16.2.5 项目方案的开发与维护 322
16.3.1 需求规划 323
16.3 业务需求定义 323
16.3.2 业务需求收集 325
16.3.3 文档形成与后续整理 327
16.4 生命周期技术路径 329
16.5 技术体系设计 329
16.5.1 创建技术体系的8步过程 330
16.6 产品选购与安装 332
16.8 维度建模 334
16.7 生命周期数据路径 334
16.9 物理设计 336
16.9.1 聚集策略 336
16.9.2 初始索引策略 337
16.10 数据转储系统的设计与开发 338
16.10.1 维度表转储处理 339
16.10.2 事实表转储 341
16.11 生命周期分析型应用路径 342
16.11.1 分析型应用程序说明 343
16.11.2 分析型应用程序的开发 343
16.12 配发 344
16.13 维护与扩展 345
16.14 建立数据仓库需要避免的常见错误 347
16.15 总结 349
第17章 相关知识与展望 350
17.1 正在出现的技术进步 351
17.2 安全需求与隐私影响方面的政治压力 353
17.2.1 有益的使用与具有险恶用心的滥用之间存在冲突 354
17.2.2 由谁掌握个人数据 355
17.2.3 可能发生什么事情 355
17.2.4 监视监控人员如何影响数据仓库的体系 356
17.3 精心设计而避免出现灾难性的失败 358
17.3.1 灾难性故障 358
17.3.2 对灾难性故障的应对 359
17.4 知识产权与公平使用 361
17.5 数据仓库应用方面的文化取向 362
17.5.1 企业范围内的数字管理 362
17.5.2 对复杂的关键性能指标存在更多的信赖 363
17.5.3 行为是新的应用大户 363
17.5.4 封装应用达到顶峰 364
17.5.5 仍然需要应用集成 364
17.5.6 采购数据仓库需要进行审慎的风险评估 365
17.6 结束语 366
术语表 367