《企业信息工厂》PDF下载

  • 购买积分:13 如何计算积分?
  • 作  者:(美)W.H.Inmon等著;邢国庆等译
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2004
  • ISBN:7505391003
  • 页数:357 页
图书介绍:本书是由誉为“数据仓库之父”的W.H.Inmon 撰写的。本书高屋建瓴,全面介绍了企业信息工厂的总体架构、组件及其相互关系,其中包括数据仓库、数据挖掘、数据集市和操作性数据存储等技术。本书简明地概括了各个组件及其相互之间的关系,说明了如何创建企业信息工厂,为企业提供决策支持,以及介绍了怎样把现有的系统改造成企业信息工厂的方法和步骤。

第1章 创建信息生态系统 1

1.1 信息生态系统的简单定义 3

1.2 转变业务模式 4

1.2.1 客户需求 5

1.2.2 竞争与复杂性 5

1.2.3 操作效率 5

1.3 应对变化 6

1.4 企业信息工厂 8

1.5 人与处理过程 9

1.6 小结 9

第2章 企业信息工厂简介 11

2.1 企业信息工厂中的数据 13

2.1.1 外部数据 15

2.1.2 引用数据 18

2.1.3 历史数据 20

2.1.4 决策支持系统的信息反馈 23

2.1.5 数据流 25

2.2 企业信息工厂的变化 27

2.3 操作型处理与 DSS 处理 27

2.4 企业信息工厂中的报表 29

2.5 企业信息工厂的用户 29

2.5.1 应用的用户 30

2.5.2 决策支持系统(DSS)/信息用户 30

2.5.3 企业信息工厂环境中的各种 DSS 用法 35

2.6 集中式还是分布式 37

2.7 数据建模与企业信息工厂 39

2.8 迁移到企业信息工厂 41

2.9 组织企业信息工厂中的数据 44

2.10 小结 46

第3章 外部世界 47

3.1 交易生产者 49

3.2 交易的分类 49

3.3 信息消费者 50

3.4 谁是参与者 50

3.5 小结 51

第4章 应用 53

4.1 应用的时效性 55

4.2 非集成化的应用 55

4.3 应用的响应时间 56

4.4 从非集成状态迁移到集成状态 56

4.5 外部数据、元数据与应用 58

4.6 应用环境的输入和输出 58

4.7 小结 60

第5章 集成转换层 61

5.1 什么是集成转换层 63

5.1.1 不稳定的接口 63

5.2 集成转换层的输入与输出 65

5.3 集成转换层的复杂性 66

5.5 创建元数据 68

5.4 数据模型的作用 68

5.5.1 集成转换程序的自动创建 69

5.6 集成转换层中的处理 69

5.6.1 执行键转换 69

5.6.2 创建简档/聚合记录 71

5.6.3 编码结构 71

5.6.4 简单的重新格式化 72

5.6.5 数学转换 72

5.6.6 数据的重排序 72

5.6.7 赋予默认值 73

5.6.8 处理多个数据源 73

5.7 把日志磁带作为数据源 73

5.8 改变平台环境 74

5.8.1 谁负责 75

5.9 小结 75

第6章 操作型数据存储(ODS) 77

6.1 什么是操作型数据存储(ODS) 79

6.1.1 可变的 80

6.1.2 反映当前数据值的 80

6.1.3 详细数据 80

6.2 ODS 的输入和输出 80

6.2.1 来自集成转换层的输入数据 81

6.3 不同类型的 ODS 82

6.3.1 一型 ODS 82

6.3.5 确定 ODS 类型 83

6.3.4 四型 ODS 83

6.3.3 三型 ODS 83

6.3.2 二型 ODS 83

6.4 动态汇总数据 84

6.5 静态汇兑数据 85

6.6 ODS 的工作负载 85

6.6.1 加载处理 86

6.6.2 更新处理 86

6.6.3 访问处理 87

6.6.4 DSS 分析处理 87

6.7 不同的处理窗口 87

6.7.1 什么是同质的工作负载 88

6.8 ODS 中的外部数据 88

6.9 小结 89

第7章 数据仓库 91

7.1 什么是数据仓库 93

7.1.1 面向主题 93

7.1.2 集成 94

7.1.3 反映数据的历史变化 94

7.1.4 历史数据 95

7.1.5 相对稳定性 96

7.1.6 包含汇总数据和详细数据 96

7.2 数据仓库管理 97

7.3 数据仓库的规模 97

7.4 数据仓库的输入与输出 98

7.4.3 输入数据仓库 99

7.4.1 来自 ODS 的输入数据 99

7.4.2 来自集成转换层的输入数据 99

7.4.4 输出到数据集市 100

7.4.5 与备用存储之间的数据传输 100

7.4.6 探索仓库的输入数据 101

7.5 数据仓库中的数据 101

7.6 数据仓库中的数据处理 102

7.7 应对技术挑战 103

7.7.1 归档从数据仓库中输出的数据 104

7.8 小结 105

第8章 数据集市 107

8.1 什么是数据集市 109

8.2 数据仓库与数据集市之间的接口 111

8.1.1 数据集市的必要性 111

8.3 不同的数据集市 113

8.3.1 MOLAP 数据集市 113

8.3.2 ROLAP 数据集市 113

8.4 星型连接模式与数据集市 114

8.5 数据集市中的数据处理 115

8.5.1 重复处理方式 115

8.5.2 不可预测的处理方式 116

8.6 第一序(First Order)数据和第二序(Second Order)数据 117

8.7 元数据 118

8.8 小结 120

第9章 数据探索仓库与数据挖掘仓库 123

9.1 探索者怎样处理大型查询 125

9.2 探索仓库的必要性 126

9.2.1 探索仓库的发展 126

9.2.2 数据挖掘仓库与数据探索仓库之间的差别 128

9.2.3 探索仓库的输入 129

9.2.4 隔离探索者的处理 130

9.2.5 何时需要探索仓库 130

9.2.6 冻结探索数据 131

9.2.7 探索仓库中的颗粒数据 132

9.3 探索仓库的数据加载 133

9.3.1 悄悄地工作——成功前的惟一方法 134

9.5 探索仓库及其有关技术 135

9.4 数据集市与探索仓库 135

9.6 探索仓库的某些潜在的好处 136

9.7 小结 137

第10章 备用存储 139

10.1 闲置数据日渐增多 141

10.1.1 管理闲置数据 142

10.1.2 找出分界线 143

10.1.3 活动监视器的位置 144

10.2 备用存储技术 145

10.2.1 元内容数据 146

10.2.2 多介质存储管理器 146

10.3 备用存储与探索处理 148

10.4.1 节省费用 149

10.4 为什么使用备用存储 149

10.4.2 良好的查询性能 150

10.4.3 保持最低颗粒级的数据 151

10.5 供应商的实现 151

10.5.1 备用存储:FileTek 152

10.5.2 多介质管理:Unitree 155

10.6 小结 156

第11章 Internet/Intranet 157

11.1 通信问题 160

11.1.1 数据量 160

11.1.3 网络容量 161

11.1.2 数据的传输速度 161

11.1.4 传输方式 162

11.1.5 电信线路的费用 162

11.1.6 传输特性 163

11.1.7 通信结构的可用性 163

11.2 谁使用通信设施 165

11.3 小结 168

第12章 元数据 169

12.1 什么是元数据 171

12.2 元数据中的冲突 172

12.2.1 集中化是否就是一种好的解决方案 173

12.2.2 自治性是否能够满足要求 174

12.2.3 寻求平衡 175

12.2.4 区分共享元数据与自主元数据 176

12.3 定义记录系统 177

12.4 使用元数据 179

12.4.1 元数据在操作环境与 DSS 环境中的使用情况 181

12.5 元数据的版本管理 183

12.6 归档与元数据 184

12.7 收集元数据 185

12.8 元进程信息 187

12.8.1 用于集成转换层 187

12.8.2 用于应用 187

12.8.3 用于从数据仓库到数据集市的数据传递 187

12.9 小结 188

第13章 决策支持能力 189

13.1.1 数据仓库增加了数据的历史深度 192

13.1 从整个上下文环境中看数据仓库的作用 192

13.1.2 历史的维度 194

13.1.3 易于访问的数据 195

13.2 数据集市分类介绍 196

13.2.1 部门级数据集市 196

13.2.2 DSS 应用式数据集市 196

13.2.3 两种数据集市之间的相似点与不同之处 197

13.2.4 每种数据集市的优缺点 198

13.3 数据集市的数据库设计 199

13.4 商业决策支持应用 202

13.4.1 ERP 分析应用 202

13.4.2 电子商务分析应用 204

13.5 数据仓库与 ODS 之间的交互 205

13.5.1 四型 ODS 的例子 206

13.6 什么是操作型数据集市 207

13.7 商品化的应用产品 208

13.7.1 商品化决策支持应用的选择指南 208

13.8 小结 210

第14章 企业信息工厂的变化 211

14.1 应当先建数据集市还是数据仓库 213

14.1.1 首先建立数据集市 214

14.1.2 随同数据仓库一起建立数据集市 215

14.2 是否应当把数据仓库和 ODS 组合在一起 223

14.2.1 不兼容的交易类型的组合 224

14.2.2 强制使不兼容的工作负载类型组合在一起 225

14.3 小结 230

第15章 建立企业信息工厂 233

15.1 策略规划 235

15.1.1 应用环境 237

15.1.2 ODS 237

15.1.3 数据仓库与数据集市 237

15.2 策略动作 238

15.3 开发方法 238

15.4 管理不同的开发机构 241

15.5 部署数据库 243

15.5.1 通用 DBMS 策略 245

15.6 不同的硬件平台 247

15.8 小结 249

15.7 显示信息 249

第16章 管理企业信息工厂 251

16.1 应用环境的日常管理 255

16.2 集成转换层的日常管理 255

16.2.1 创建和维护接口 256

16.2.2 执行代码 256

16.2.3 元数据的生成 257

16.3 ODS 的日常管理 257

16.4 数据仓库的日常管理 258

16.5 数据集市的日常管理 259

16.6 Internet/Intranet 的日常管理 259

16.7 监控企业信息工厂 259

16.8 企业信息工厂中的安全考虑 261

16.9 归档处理 264

16.9.1 应用归档 264

16.9.2 ODS 归档 266

16.9.3 数据仓库归档 266

16.9.4 数据集市归档 266

16.9.5 归档介质 267

16.10 小结 267

第17章 分布于大型企业中的多个数据仓库 269

17.1 定义集成需求 271

17.2 定义企业框架 272

17.2.1 业务范围 272

17.2.2 数据的类型和实例 273

17.2.3 数据的属主 274

17.2.4 共享数据 275

17.2.5 在多个数据仓库中共享数据 276

17.2.6 相关的数据实例 277

17.2.7 其他关系 278

17.3 定义记录系统 280

17.4 本地数据仓库 281

17.4.1 “纯”本地数据仓库的变体 281

17.5 全局数据仓库 282

17.6 企业中数据仓库的类型 282

17.6.2 简单的全局数据仓库 284

17.6.1 简单的本地数据仓库 284

17.6.3 多个不相关的本地数据仓库 286

17.6.4 业务范围之间的关系 286

17.6.5 交叉需求 287

17.6.6 扩展的全局数据仓库 288

17.7 企业范围架构中的其他重要问题 289

17.8 小结 289

附录A 企业信息工厂架构指南 291

A.1 标准的企业信息工厂构件 294

A.1.1 目的 294

A.1.2 重点问题 294

A.1.3 集成转换层 295

A.1.4 ODS(选用的) 295

A.1.5 数据仓库 296

A.1.6 数据集市 297

A.1.7 探索仓库(选用的) 298

A.1.8 备用存储(选用的) 299

A.2 其他企业信息工厂构件 300

A.2.1 目的 300

A.2.2 重点问题 300

A.2.3 ERP 300

A.2.4 SAP 301

A.2.5 BAAN 301

A.2.6 PeopleSoft 301

A.2.10 CRM 302

A.2.9 电子商务 302

A.2.8 Oracle Financials 302

A.2.7 J D Edwards 302

A.2.11 其他分析应用 303

A.3 企业信息工厂的变化 303

A.3.1 目的 303

A.3.2 分布式数据仓库 303

A.3.3 全局数据仓库 304

A.4 标准操作 305

A.4.1 目的 305

A.4.2 重点问题 305

A.4.3 正常数据流情况 305

A.5.2 重点问题 306

A.5.1 目的 306

A.5 监控 306

A.4.4 逆向数据流情况 306

A.4.5 更新与快照 306

A.5.3 数据仓库 307

A.5.4 网络 307

A.5.5 备用存储 308

A.6 数据集市与最终用户访问 308

A.6.1 目的 308

A.6.2 重点问题 308

A.7.2 重点问题 309

A.8.1 目的 309

A.8 数据仓库的纠错 309

A.7.1 目的 309

A.7 数据仓库的协调与调整 309

A.8.2 特定的问题 310

A.9 企业信息工厂的保密性和安全性 310

A.9.1 目的 310

A.9.2 重点问题 310

A.10 数据量 310

A.10.1 目的 310

A.10.2 重点问题 311

A.10.3 预测 311

A.10.8 备用存储 312

A.10.7 应对未来 312

A.10.6 分界线 312

A.10.4 增长率 312

A.10.5 当前状态 312

A.10.9 数据存储规则 313

A.11 探索仓库 313

A.11.1 目的 313

A.11.2 重点问题 313

A.11.3 查询 314

A.11.4 数据量 314

A.11.5 外部数据 315

A.12.1 目的 316

A.12.2 重要问题 316

A.12 技术覆盖 316

A.12.3 系统 317

A.12.4 硬件 317

A.12.5 DBMS 317

A.12.6 最终用户工具 318

A.12.7 中间件 318

A.12.8 交易管理 319

A.13 设计覆盖 320

A.13.1 目的 320

A.13.2 规范化 320

A.13.3 星型连接/雪花模式 320

A.14.4 Web 内部 ODS 321

A.14.2 粒度管理 321

A.14.3 ODS 支持 321

A.14.1 目的 321

A.14 Web 接口 321

A.14.5 企业信息工厂 ODS 322

A.14.6 点击流管理 322

A.15 开发方法 322

A.15.1 目的 322

A.15.2 重点问题 323

A.16 元数据 323

A.16.1 目的 323

A.16.2 重点问题 323

A.16.6 中央存储 324

A.16.5 记录系统 324

A.16.4 共享 324

A.16.3 本地收集与自包含 324

A.17 企业信息工厂机构管理 325

A.17.1 目的 325

A.17.2 重点问题 325

A.17.3 机构管理 325

A.18 数据仓库的性能 326

A.18.1 目的 326

A.18.2 索引 326

A.18.3 ODS 327

A.18.4 数据集市 327

A.18.5 顺序存储设备 327

A.18.9 聚合 328

A.18.8 汇总 328

A.18.7 探索仓库 328

A.18.6 非规范化处理 328

A.18.10 冗余 329

A.18.11 数据共处 329

A.18.12 数据加载的优化 329

A.18.13 监控 329

A.18.14 服务级的一致性 330

A.19 预算 330

A.19.1 目的 330

A.20 端到端的数据流速度 330

A.20.1 目的 330

A.21.2 怎样监控 331

A.21.1 目的 331

A.21 企业信息工厂管理 331

A.21.3 容量规划 332

A.21.4 异常管理 332

A.21.5 监控程序的开销 332

A.21.6 监控程序的复杂性 333

A.22 企业信息工厂的历史 333

A.22.1 目的 333

A.22.2 开发周期 333

A.22.3 规模 333

A.22.4 增长率 333

A.22.5 各个构件的建设顺序 334

附录B 术语解释 335