第一篇 结构基础 1
第1章 数据仓库导论 1
1.1 什么是数据仓库 1
目录 1
1.2 本书适合于哪些人 3
1.3.2 第二篇——设计与构造 4
1.3.4 第四篇——数据仓库现状 4
1.3.3 第三篇——收益 4
1.3.1 第一篇——结构基础 4
1.3 本书的内容安排 4
1.4 本书特色 5
1.4.1 业界现状 5
1.4.2 本书的重点 6
第2章 了解数据仓库的总轮廓 8
2.1 建立和使用数据仓库的复杂性 8
2.2 框架的重要性 9
2.3 一个信息系统框架 10
2.4 紧要任务系统中的数据仓库 12
2.5 数据仓库需求 13
2.6 需求面面观 15
2.6.1 投资者/业主 16
2.6.2 商业用户 16
2.6.3 设计者和系统实现者 16
2.7 通用结构需要什么 17
2.8 参照结构 19
2.8.1 数据源块 20
2.8.2 数据仓库结构块 21
2.8.3 数据站场结构块 23
2.8.4 数据仓库的存取和使用模块 24
2.8.5 数据管理层 25
2.8.6 元数据管理层 26
2.8.7 传输层 27
2.8.8 基础结构层 28
2.8.9 参照结构的详情 29
2.9 参照结构的优点 29
2.10 小结 31
第3章 数据仓库参照结构的运用 32
3.1.1 垂直剖析 33
3.1 参照结构用作分析 33
3.1.2 水平剖析 35
3.2 数据仓库参照结构的抽象视点 36
3.2.1 设计空间 37
3.2.2 参照结构如何分割设计空间 38
3.3 Indica数据仓库规划器的用法 40
3.3.1 怎样建立规划器的知识库 41
3.3.2 如何根据使用的不同详细程度选用结构层次 42
3.4.1 问题 43
3.4 商务难点:数据仓库/工程项目的规划和范围选择 43
3.4.2 规划器引用的知识库 44
3.5 商务难点:建立一个能够容纳已有投资的数据仓库 47
3.5.1 问题 47
3.5.2 规划器引用的知识库 48
3.6 商务难点:数据仓库项目组的选定和小组成员的分工 49
3.6.1 问题 49
3.6.2 规划器引用的知识库 49
3.7 商务难点:部门与公司的数据仓库结构的合并 50
3.7.2 规划器引用的知识库 51
3.7.1 问题 51
3.8 小结 54
第二篇 设计与构造 55
第4章 建立数据仓库:入门指南 55
4.1 开发生存期 55
4.1.1 规划 56
4.1.2 需求 67
4.1.3 分析 76
4.1.4 设计 77
4.1.6 试用 78
4.1.5 构造 78
4.1.7 扩充 79
4.2 小结 80
第5章 理解和分析商务需要 81
5.1 分析框架 81
5.1.1 自顶向下观点 82
5.1.2 数据源观点 83
5.1.3 数据仓库观点 84
5.1.4 商务查询观点 86
5.2 数据源建模 87
5.3.1 星型模式 88
5.3 数据仓库建模 88
5.3.2 雪花模式 89
5.3.3 混合模式 89
5.4 商务查询建模 89
5.5 小结 94
6.1 初期试运行 95
6.1.1 最初安装 95
第6章 开发和试运行数据仓库 95
6.1.2 拓展规划 96
6.1.3 培训与目标 96
6.2 平台升级与维护 96
6.2.1 基础块 98
6.2.2 传输块 98
6.2.3 最终用户的访问与使用 98
6.2.4 数据管理 99
6.2.5 元数据管理 100
6.3 数据仓库的管理 100
6.3.1 数据刷新、更新/复制 101
6.3.3 故障恢复 102
6.3.2 数据源的同步化 102
6.3.4 访问控制与安全性 103
6.3.5 数据增长的管理 103
6.3.6 数据库性能的管理 105
6.3.7 数据仓库的增强与扩充 107
6.4.2 技术补偿 108
6.4.3 实现的时间安排 108
6.4.1 有关商业用户的需要 108
6.4 作用域的管理 108
6.4.4 预算分配 109
6.4.5 资源分配 109
6.5 小结 109
第7章 元数据管理的重要性 110
7.1 何为元数据 110
7.2 元数据为何重要 112
7.2.1 仓库开发期间元数据的重要性 114
7.2.2 数据源抽取 115
7.2.3 数据求精与重构工程 116
7.2.4 访问与使用 118
7.3.1 数据仓库信息的目录 119
7.3 持续存储与管理元数据 119
7.3.2 信息目录的现状 121
7.3.3 元数据的数据字典和纲目库 121
7.3.4 数据字典/纲目库的现状 122
7.4 元数据标准 122
7.5 元数据也应商品化 123
7.6 小结 124
8.1 数据仓库的用途 125
8.1.1 “获取数据” 125
第三篇 收益 125
第8章 数据仓库的使用 125
8.1.2 价值和用途综述 126
8.1.3 收取信息 127
8.1.4 数据仓库和运作系统 127
8.2 数据仓库的潜力 128
8.2.4 顾客关系管理 129
8.2.3 改变竞争的基础 129
8.2.2 策略管理 129
8.2.1 利润增长分析 129
8.2.5 公司财产管理 130
8.2.6 商业过程的重构工程(BPR)和全面质量管理(TQM) 130
8.3 数据仓库的应用 130
8.3.1 银行与财经部门 131
8.3.2 消费品和零售网点 131
8.3.3 制造业 131
8.4 数据仓库的用户及其需要 131
8.4.1 基本需要 132
8.4.2 商务需要 133
8.4.3 技术需要 133
8.5 使用数据仓库 134
8.5.1 使用数据仓库的技术 136
8.5.2 数据特征化 137
8.5.3 用于分析的数据源 137
8.5.4 解决商业问题的步骤 138
8.5.5 使用分析方法 142
8.5.6 互通分析结果 144
8.6 小结 144
第9章 查询和报表:信息处理 145
9.1 信息处理 147
9.1.1 定义查询 148
9.1.2 访问和检索数据 148
9.1.3 计算、操作和分析数据 148
9.1.4 信息的表现 149
9.1.5 传播信息 149
9.2 信息处理的用户和环境 149
9.2.1 信息处理的用户 149
9.2.2 信息处理的环境 152
9.3 信息处理的功能和特征 153
9.3.1 商业用户:获利 153
9.3.2 数据仓库的管理员:发掘价值 155
9.4 信息处理的经济上的考虑 156
9.4.1 分析准则 156
9.4.2 平衡技巧 157
9.5 信息处理工具:技术上的考虑 158
9.5.1 结构 158
9.5.3 性能 159
9.5.4 环境 159
9.5.2 元数据管理 159
9.5.5 安全性和访问控制 160
9.5.6 报表和图表的传输 160
9.5.7 代理技术 160
9.5.8 用户支持的范围 161
9.5.9 规模伸缩性 161
9.6 信息处理技术的趋势 161
9.7 小结 161
第10章 分析处理 163
10.2 多维分析 164
10.1 商业用户的数据观点 164
10.3 在线分析处理(OLAP) 166
10.3.1 定义OLAP 166
10.3.2 OLAP的结构 166
10.4 OLAP:多维的与关系的 169
10.4.1 多维数据存储和关系数据存储 170
10.4.2 多维数据库服务器和关系OLAP服务器 171
10.4.3 多维数据存储和OLAP的服务设施 171
10.4.4 关系的OLAP 173
10.5.1 OLAP的12条规则 175
10.5 OLAP:技术需求和重点 175
10.5.2 OLAP服务器和工具的评价 176
10.6 小结 179
第四篇 数据仓库现状 180
第11章 数据发掘 180
11.1 数据发掘的层面 180
11.1.1 数据发掘的用户 183
11.1.2 数据发掘应用的关键作用 183
11.2.1 利用统计分析工具 184
11.2 统计分析 184
11.1.3 数据发掘技术和工具 184
11.2.2 统计分析工具的特点 185
11.2.3 统计分析的用途 186
11.2.4 使用统计分析技术的问题 186
11.3 知识发现 187
11.3.1 知识发现系统的一般结构 187
11.3.2 知识发现技术 190
11.3.3 知识发现技术的商业应用 192
11.3.4 知识发现工具的系统结构 193
11.3.5 知识发现工具运用中的问题 194
11.3.6 知识发现的价值 195
11.4 其他数据发掘技术和工具 196
11.4.1 可视化系统 196
11.4.2 地理信息系统 196
11.4.3 分形分析 196
11.4.4 私有发现引擎 196
11.5 小结 197
第12章 现状——哪些东西可用 198
12.1.2 制售商框架 199
12.1 数据仓库实现方法 199
12.1.1 构造自己的数据仓库 199
12.1.3 主供应商(产品或设备的主要制售商) 200
12.2 制售商分析概述 200
12.2.1 方案供应商还是构件供应商 201
12.2.2 制售商竞争动力学 202
12.2.3 数据仓库的参照结构 205
12.3 制售商评价指南 208
12.3.4 伙伴的质量 210
12.3.3 从逆境中恢复和活动的能力 210
12.3.1 制售商的信誉与核心技术的竞争力 210
12.3.2 产品和方案的竞争力 210
12.3.5 方案的范围 211
12.3.6 后续技术支持和服务 211
12.3.7 专业服务 211
12.3.8 标准和开放的系统 211
12.3.9 价格 211
12.4 小结 212
13.1 IBM 213
第13章 制售商调查:策略和产品定位 213
13.2 Oracle 215
13.3 惠普 216
13.4 Sybase 216
13.5 Informix Software 217
13.6 AT T GIS 218
13.7 SAS Institute 219
13.8 Software AG 220
13.9 Platinum technology 220
13.11 Silicon Graphics 221
13.10 Red Brick Systems 221
13.12 Pyramid Technology 222
13.13 Sequent Computer Systems 222
13.14 Information builders 223
13.15 Prism Software 223
13.16 Informatica Corporation 224
13.17 Vality Technology 225
13.18 Evolutionary Technologies International(ETI) 225
13.21 Arbor Software 226
13.20 Praxis International 226
13.19 Carleton 226
13.22 Pilot Software 227
13.23 Dimensional Insight 227
13.24 Information Advantage 227
13.25 Prodea Software 228
13.26 MicroStrategy 228
13.27 Brio Technology 228
13.29 Business Objects 229
13.30 Information Harvesting 229
13.28 IQ Software 229
13.31 Infromation Discovery 230
13.32 HNC Software 230
13.33 SPSS 230
13.34 小结 230
第14章 数据仓库成本估算 232
14.1 为什么要建立数据仓库 232
14.1.2 现有系统的状况 233
14.1.1 管理中的问题 233
14.1.3 数据仓库的价值 234
14.2 早期数据仓库的经验 235
14.2.1 数据仓库的目标 235
14.2.2 早期数据仓库的用途 236
14.2.3 经济性 236
14.2.4 所遇到的问题 237
14.3 数据仓库:开发商业应用实例 238
14.3.1 建立商业经济(成本调整)模型 240
14.3.3 技术风险管理 245
14.3.2 技术分析和风险管理 245
14.4 商业分析示例 247
14.4.1 利润增长(ROI影响) 247
14.4.2 增加资产的利用率(ROA影响) 247
14.4.3 单个项目:营销活动的投资回报 248
14.5 小结 248
附录 250
附录A 数据仓库的规划器 250
A.1 规划器概述 251
A.2.1 建立一个新计划 252
A.2 特征和功能 252
A.2.2 定制供应商的计划 255
A.2.3 计划的保存 256
A.2.4 多个计划的合并 256
A.2.5 计划中条目报表的生成 256
A.2.6 数据仓库结构示例 256
A.2.7 帮助窗口 256
A.3 安装 257
附录B 参考文献和资料来源 257
附录C 词汇表 269