第1章 创建信息生态系统 1
1.1 信息生态系统的简单定义 3
1.2 转变业务模式 4
1.2.1 客户需求 5
1.2.2 竞争与复杂性 5
1.2.3 操作效率 5
1.3 应对变化 6
1.4 企业信息工厂 8
1.5 人与处理过程 9
1.6 小结 9
第2章 企业信息工厂简介 11
2.1 企业信息工厂中的数据 13
2.1.1 外部数据 15
2.1.2 引用数据 18
2.1.3 历史数据 20
2.1.4 决策支持系统的信息反馈 23
2.1.5 数据流 25
2.2 企业信息工厂的变化 27
2.3 操作型处理与 DSS 处理 27
2.4 企业信息工厂中的报表 29
2.5 企业信息工厂的用户 29
2.5.1 应用的用户 30
2.5.2 决策支持系统(DSS)/信息用户 30
2.5.3 企业信息工厂环境中的各种 DSS 用法 35
2.6 集中式还是分布式 37
2.7 数据建模与企业信息工厂 39
2.8 迁移到企业信息工厂 41
2.9 组织企业信息工厂中的数据 44
2.10 小结 46
第3章 外部世界 47
3.1 交易生产者 49
3.2 交易的分类 49
3.3 信息消费者 50
3.4 谁是参与者 50
3.5 小结 51
第4章 应用 53
4.1 应用的时效性 55
4.2 非集成化的应用 55
4.3 应用的响应时间 56
4.4 从非集成状态迁移到集成状态 56
4.5 外部数据、元数据与应用 58
4.6 应用环境的输入和输出 58
4.7 小结 60
第5章 集成转换层 61
5.1 什么是集成转换层 63
5.1.1 不稳定的接口 63
5.2 集成转换层的输入与输出 65
5.3 集成转换层的复杂性 66
5.5 创建元数据 68
5.4 数据模型的作用 68
5.5.1 集成转换程序的自动创建 69
5.6 集成转换层中的处理 69
5.6.1 执行键转换 69
5.6.2 创建简档/聚合记录 71
5.6.3 编码结构 71
5.6.4 简单的重新格式化 72
5.6.5 数学转换 72
5.6.6 数据的重排序 72
5.6.7 赋予默认值 73
5.6.8 处理多个数据源 73
5.7 把日志磁带作为数据源 73
5.8 改变平台环境 74
5.8.1 谁负责 75
5.9 小结 75
第6章 操作型数据存储(ODS) 77
6.1 什么是操作型数据存储(ODS) 79
6.1.1 可变的 80
6.1.2 反映当前数据值的 80
6.1.3 详细数据 80
6.2 ODS 的输入和输出 80
6.2.1 来自集成转换层的输入数据 81
6.3 不同类型的 ODS 82
6.3.1 一型 ODS 82
6.3.5 确定 ODS 类型 83
6.3.4 四型 ODS 83
6.3.3 三型 ODS 83
6.3.2 二型 ODS 83
6.4 动态汇总数据 84
6.5 静态汇兑数据 85
6.6 ODS 的工作负载 85
6.6.1 加载处理 86
6.6.2 更新处理 86
6.6.3 访问处理 87
6.6.4 DSS 分析处理 87
6.7 不同的处理窗口 87
6.7.1 什么是同质的工作负载 88
6.8 ODS 中的外部数据 88
6.9 小结 89
第7章 数据仓库 91
7.1 什么是数据仓库 93
7.1.1 面向主题 93
7.1.2 集成 94
7.1.3 反映数据的历史变化 94
7.1.4 历史数据 95
7.1.5 相对稳定性 96
7.1.6 包含汇总数据和详细数据 96
7.2 数据仓库管理 97
7.3 数据仓库的规模 97
7.4 数据仓库的输入与输出 98
7.4.3 输入数据仓库 99
7.4.1 来自 ODS 的输入数据 99
7.4.2 来自集成转换层的输入数据 99
7.4.4 输出到数据集市 100
7.4.5 与备用存储之间的数据传输 100
7.4.6 探索仓库的输入数据 101
7.5 数据仓库中的数据 101
7.6 数据仓库中的数据处理 102
7.7 应对技术挑战 103
7.7.1 归档从数据仓库中输出的数据 104
7.8 小结 105
第8章 数据集市 107
8.1 什么是数据集市 109
8.2 数据仓库与数据集市之间的接口 111
8.1.1 数据集市的必要性 111
8.3 不同的数据集市 113
8.3.1 MOLAP 数据集市 113
8.3.2 ROLAP 数据集市 113
8.4 星型连接模式与数据集市 114
8.5 数据集市中的数据处理 115
8.5.1 重复处理方式 115
8.5.2 不可预测的处理方式 116
8.6 第一序(First Order)数据和第二序(Second Order)数据 117
8.7 元数据 118
8.8 小结 120
第9章 数据探索仓库与数据挖掘仓库 123
9.1 探索者怎样处理大型查询 125
9.2 探索仓库的必要性 126
9.2.1 探索仓库的发展 126
9.2.2 数据挖掘仓库与数据探索仓库之间的差别 128
9.2.3 探索仓库的输入 129
9.2.4 隔离探索者的处理 130
9.2.5 何时需要探索仓库 130
9.2.6 冻结探索数据 131
9.2.7 探索仓库中的颗粒数据 132
9.3 探索仓库的数据加载 133
9.3.1 悄悄地工作——成功前的惟一方法 134
9.5 探索仓库及其有关技术 135
9.4 数据集市与探索仓库 135
9.6 探索仓库的某些潜在的好处 136
9.7 小结 137
第10章 备用存储 139
10.1 闲置数据日渐增多 141
10.1.1 管理闲置数据 142
10.1.2 找出分界线 143
10.1.3 活动监视器的位置 144
10.2 备用存储技术 145
10.2.1 元内容数据 146
10.2.2 多介质存储管理器 146
10.3 备用存储与探索处理 148
10.4.1 节省费用 149
10.4 为什么使用备用存储 149
10.4.2 良好的查询性能 150
10.4.3 保持最低颗粒级的数据 151
10.5 供应商的实现 151
10.5.1 备用存储:FileTek 152
10.5.2 多介质管理:Unitree 155
10.6 小结 156
第11章 Internet/Intranet 157
11.1 通信问题 160
11.1.1 数据量 160
11.1.3 网络容量 161
11.1.2 数据的传输速度 161
11.1.4 传输方式 162
11.1.5 电信线路的费用 162
11.1.6 传输特性 163
11.1.7 通信结构的可用性 163
11.2 谁使用通信设施 165
11.3 小结 168
第12章 元数据 169
12.1 什么是元数据 171
12.2 元数据中的冲突 172
12.2.1 集中化是否就是一种好的解决方案 173
12.2.2 自治性是否能够满足要求 174
12.2.3 寻求平衡 175
12.2.4 区分共享元数据与自主元数据 176
12.3 定义记录系统 177
12.4 使用元数据 179
12.4.1 元数据在操作环境与 DSS 环境中的使用情况 181
12.5 元数据的版本管理 183
12.6 归档与元数据 184
12.7 收集元数据 185
12.8 元进程信息 187
12.8.1 用于集成转换层 187
12.8.2 用于应用 187
12.8.3 用于从数据仓库到数据集市的数据传递 187
12.9 小结 188
第13章 决策支持能力 189
13.1.1 数据仓库增加了数据的历史深度 192
13.1 从整个上下文环境中看数据仓库的作用 192
13.1.2 历史的维度 194
13.1.3 易于访问的数据 195
13.2 数据集市分类介绍 196
13.2.1 部门级数据集市 196
13.2.2 DSS 应用式数据集市 196
13.2.3 两种数据集市之间的相似点与不同之处 197
13.2.4 每种数据集市的优缺点 198
13.3 数据集市的数据库设计 199
13.4 商业决策支持应用 202
13.4.1 ERP 分析应用 202
13.4.2 电子商务分析应用 204
13.5 数据仓库与 ODS 之间的交互 205
13.5.1 四型 ODS 的例子 206
13.6 什么是操作型数据集市 207
13.7 商品化的应用产品 208
13.7.1 商品化决策支持应用的选择指南 208
13.8 小结 210
第14章 企业信息工厂的变化 211
14.1 应当先建数据集市还是数据仓库 213
14.1.1 首先建立数据集市 214
14.1.2 随同数据仓库一起建立数据集市 215
14.2 是否应当把数据仓库和 ODS 组合在一起 223
14.2.1 不兼容的交易类型的组合 224
14.2.2 强制使不兼容的工作负载类型组合在一起 225
14.3 小结 230
第15章 建立企业信息工厂 233
15.1 策略规划 235
15.1.1 应用环境 237
15.1.2 ODS 237
15.1.3 数据仓库与数据集市 237
15.2 策略动作 238
15.3 开发方法 238
15.4 管理不同的开发机构 241
15.5 部署数据库 243
15.5.1 通用 DBMS 策略 245
15.6 不同的硬件平台 247
15.8 小结 249
15.7 显示信息 249
第16章 管理企业信息工厂 251
16.1 应用环境的日常管理 255
16.2 集成转换层的日常管理 255
16.2.1 创建和维护接口 256
16.2.2 执行代码 256
16.2.3 元数据的生成 257
16.3 ODS 的日常管理 257
16.4 数据仓库的日常管理 258
16.5 数据集市的日常管理 259
16.6 Internet/Intranet 的日常管理 259
16.7 监控企业信息工厂 259
16.8 企业信息工厂中的安全考虑 261
16.9 归档处理 264
16.9.1 应用归档 264
16.9.2 ODS 归档 266
16.9.3 数据仓库归档 266
16.9.4 数据集市归档 266
16.9.5 归档介质 267
16.10 小结 267
第17章 分布于大型企业中的多个数据仓库 269
17.1 定义集成需求 271
17.2 定义企业框架 272
17.2.1 业务范围 272
17.2.2 数据的类型和实例 273
17.2.3 数据的属主 274
17.2.4 共享数据 275
17.2.5 在多个数据仓库中共享数据 276
17.2.6 相关的数据实例 277
17.2.7 其他关系 278
17.3 定义记录系统 280
17.4 本地数据仓库 281
17.4.1 “纯”本地数据仓库的变体 281
17.5 全局数据仓库 282
17.6 企业中数据仓库的类型 282
17.6.2 简单的全局数据仓库 284
17.6.1 简单的本地数据仓库 284
17.6.3 多个不相关的本地数据仓库 286
17.6.4 业务范围之间的关系 286
17.6.5 交叉需求 287
17.6.6 扩展的全局数据仓库 288
17.7 企业范围架构中的其他重要问题 289
17.8 小结 289
附录A 企业信息工厂架构指南 291
A.1 标准的企业信息工厂构件 294
A.1.1 目的 294
A.1.2 重点问题 294
A.1.3 集成转换层 295
A.1.4 ODS(选用的) 295
A.1.5 数据仓库 296
A.1.6 数据集市 297
A.1.7 探索仓库(选用的) 298
A.1.8 备用存储(选用的) 299
A.2 其他企业信息工厂构件 300
A.2.1 目的 300
A.2.2 重点问题 300
A.2.3 ERP 300
A.2.4 SAP 301
A.2.5 BAAN 301
A.2.6 PeopleSoft 301
A.2.10 CRM 302
A.2.9 电子商务 302
A.2.8 Oracle Financials 302
A.2.7 J D Edwards 302
A.2.11 其他分析应用 303
A.3 企业信息工厂的变化 303
A.3.1 目的 303
A.3.2 分布式数据仓库 303
A.3.3 全局数据仓库 304
A.4 标准操作 305
A.4.1 目的 305
A.4.2 重点问题 305
A.4.3 正常数据流情况 305
A.5.2 重点问题 306
A.5.1 目的 306
A.5 监控 306
A.4.4 逆向数据流情况 306
A.4.5 更新与快照 306
A.5.3 数据仓库 307
A.5.4 网络 307
A.5.5 备用存储 308
A.6 数据集市与最终用户访问 308
A.6.1 目的 308
A.6.2 重点问题 308
A.7.2 重点问题 309
A.8.1 目的 309
A.8 数据仓库的纠错 309
A.7.1 目的 309
A.7 数据仓库的协调与调整 309
A.8.2 特定的问题 310
A.9 企业信息工厂的保密性和安全性 310
A.9.1 目的 310
A.9.2 重点问题 310
A.10 数据量 310
A.10.1 目的 310
A.10.2 重点问题 311
A.10.3 预测 311
A.10.8 备用存储 312
A.10.7 应对未来 312
A.10.6 分界线 312
A.10.4 增长率 312
A.10.5 当前状态 312
A.10.9 数据存储规则 313
A.11 探索仓库 313
A.11.1 目的 313
A.11.2 重点问题 313
A.11.3 查询 314
A.11.4 数据量 314
A.11.5 外部数据 315
A.12.1 目的 316
A.12.2 重要问题 316
A.12 技术覆盖 316
A.12.3 系统 317
A.12.4 硬件 317
A.12.5 DBMS 317
A.12.6 最终用户工具 318
A.12.7 中间件 318
A.12.8 交易管理 319
A.13 设计覆盖 320
A.13.1 目的 320
A.13.2 规范化 320
A.13.3 星型连接/雪花模式 320
A.14.4 Web 内部 ODS 321
A.14.2 粒度管理 321
A.14.3 ODS 支持 321
A.14.1 目的 321
A.14 Web 接口 321
A.14.5 企业信息工厂 ODS 322
A.14.6 点击流管理 322
A.15 开发方法 322
A.15.1 目的 322
A.15.2 重点问题 323
A.16 元数据 323
A.16.1 目的 323
A.16.2 重点问题 323
A.16.6 中央存储 324
A.16.5 记录系统 324
A.16.4 共享 324
A.16.3 本地收集与自包含 324
A.17 企业信息工厂机构管理 325
A.17.1 目的 325
A.17.2 重点问题 325
A.17.3 机构管理 325
A.18 数据仓库的性能 326
A.18.1 目的 326
A.18.2 索引 326
A.18.3 ODS 327
A.18.4 数据集市 327
A.18.5 顺序存储设备 327
A.18.9 聚合 328
A.18.8 汇总 328
A.18.7 探索仓库 328
A.18.6 非规范化处理 328
A.18.10 冗余 329
A.18.11 数据共处 329
A.18.12 数据加载的优化 329
A.18.13 监控 329
A.18.14 服务级的一致性 330
A.19 预算 330
A.19.1 目的 330
A.20 端到端的数据流速度 330
A.20.1 目的 330
A.21.2 怎样监控 331
A.21.1 目的 331
A.21 企业信息工厂管理 331
A.21.3 容量规划 332
A.21.4 异常管理 332
A.21.5 监控程序的开销 332
A.21.6 监控程序的复杂性 333
A.22 企业信息工厂的历史 333
A.22.1 目的 333
A.22.2 开发周期 333
A.22.3 规模 333
A.22.4 增长率 333
A.22.5 各个构件的建设顺序 334
附录B 术语解释 335