目录 1
第一篇 数据仓库及OLAP概念、原理和技术篇 1
第1章 数据仓库基本概念 1
1.1 从数据库到数据仓库 1
1.1.1 蜘蛛网问题 1
1.1.2 事务型系统和分析型系统的分离 4
1.2 什么是数据仓库 6
1.2.1 面向主题 6
1.2.2 集成 7
1.2.3 稳定性 8
1.2.4 随时间而变化 9
1.3 数据仓库的体系结构 9
1.3.1 数据仓库的体系结构 9
1.3.2 数据仓库中的关键名词 10
1.4.1 数据仓库的数据组织结构 13
1.4 数据仓库的数据组织 13
1.4.2 数据粒度与数据分割 14
1.4.3 数据仓库的数据组织形式 15
1.4.4 数据仓库的数据追加和清理 17
1.5 本章小结 19
习题 19
2.1 ETL 20
2.1.1 ETL概念 20
第2章 数据仓库中的ETL和元数据 20
2.1.2 ETL作用 23
2.1.3 ETL工具 23
2.2 元数据 26
2.2.1 什么是元数据 27
2.2.2 元数据的标准化 31
2.2.3 数据仓库中的元数据管理 32
2.2.4 在数据仓库项目中使用元数据的建议 34
2.3.1 外部数据和非结构化数据 35
2.3 外部数据 35
2.3.2 元数据和外部数据 36
2.3.3 外部数据的存储 36
2.3.4 外部数据的管理 37
2.4 本章小结 37
习题 38
第3章 数据仓库模型设计 39
3.1 数据仓库模型设计方法概述 39
3.2 数据仓库设计的三级数据模型 40
3.2.1 概念模型 41
3.2.2 逻辑模型 41
3.2.3 物理模型 41
3.2.4 三种模型之间的关系 41
3.2.5 高级模型、中级模型和低级模型 42
3.3.1 E-R模型 43
3.3 数据仓库的概念模型设计 43
3.3.2 面向对象的分析方法 46
3.4 数据仓库的逻辑模型设计 48
3.4.1 分析主题,确定当前要装载的主题 48
3.4.2 确定数据粒度的选择 49
3.4.3 确定数据分割策略 53
3.4.4 增加导出字段 54
3.4.5 定义关系模式 54
3.4.6 定义记录系统 55
3.5 数据仓库的物理模型设计 55
3.5.1 存储结构 55
3.5.2 索引策略 59
3.5.3 数据存储策略 65
3.5.4 存储分配优化 67
3.6 数据装载接口设计 68
习题 69
3.7 本章小结 69
第4章 数据仓库的建立和维护 71
4.1 数据仓库的投资分析 71
4.1.1 建设数据仓库的必要性 71
4.1.2 数据仓库的投资回报分析 72
4.2 数据仓库的开发方法 73
4.2.1 瀑布式开发 73
4.2.2 螺旋式开发 74
4.3 数据仓库的建立过程 74
4.3.1 需求分析 75
4.3.2 数据路线 76
4.3.3 技术路线 77
4.3.4 应用路线 81
4.3.5 数据仓库部署 87
4.4.1 数据周期 88
4.4 数据仓库的维护 88
4.3.6 运行维护 88
4.4.2 参照完整性 89
4.4.3 数据环境信息 90
4.4.4 数据备份与恢复 91
4.5 提高数据仓库性能 92
4.5.1 提高I/O性能 92
4.5.2 缩小查询范围 93
4.5.3 采取并行优化技术 93
4.5.4 选择适当的初始化参数 95
4.6 数据仓库的安全性 95
4.6.1 安全类型 96
4.6.2 安全方法 96
4.7 本章小结 100
习题 101
5.1 什么是数据集市 102
第5章 数据仓库与数据集市的关系 102
5.2 数据集市的类型 103
5.3 数据集市与数据仓库的区别 104
5.4 数据集市的特点 105
5.5 数据集市的开发方法 106
5.6 数据集市的建立 107
5.7 本章小结 108
习题 108
第6章 联机分析处理(OLAP) 109
6.1 OLAP概念 109
6.1.1 什么是OLAP 109
6.1.2 OLAP的相关基本概念 109
6.1.3 OLAP和OLTP的区别 110
6.2 OLAP的基本操作 111
6.2.1 数据切片 111
6.2.3 数据上探/下钻 113
6.2.2 数据切块 113
6.2.4 数据旋转 114
6.3 OLAP分类和体系结构 115
6.3.1 OLAP的三层客户/服务器结构 115
6.3.2 OLAP的分类 115
6.3.3 OLAP的体系结构 116
6.4 基于多维数据库的OLAP(MOLAP) 118
6.4.1 多维数据库 118
6.4.2 维的分类 119
6.4.3 多维数据库存储 121
6.5 基于关系数据库的OLAP(ROLAP) 121
6.5.1 维表和事实表 121
6.5.2 星型模型和雪花模型 125
6.5.3 星座模型和雪暴模型 127
6.5.4 ROLAP与MOLAP比较 129
6.5.5 HOLAP 131
6.6 OLAP的衡量和特性 132
6.6.1 OLAP的12准则 132
6.6.2 OLAP的简洁准则(OLAP的特性) 135
6.7 OLAP的前端展现方式 136
6.7.1 OLAP实现架构 136
6.7.2 OLAP的Web呈现方式 137
6.7.3 瘦客户机方式 137
6.7.4 OLAP的前端展现 137
6.8 OLAP的发展及展望 140
6.8.1 OLAP在应用领域的发展趋势 140
6.8.2 OLAP基于Web的应用 142
6.8.3 OLAP展望 142
6.9 本章小结 143
习题 143
7.1 在电信业的应用前景 144
第7章 数据仓库的应用前景 144
7.2 在客户服务及营销方面的应用前景 146
7.3 在银行领域的应用前景 147
7.4 在保险业的应用前景 148
7.5 在图书馆领域的应用前景 148
7.6 成功案例分析 149
7.7 本章小结 154
习题 154
第二篇 数据挖掘技术篇 155
第8章 数据挖掘介绍 155
8.1 数据挖掘概述 155
8.2 数据挖掘分类 157
8.2.1 概述 157
8.2.2 描述性挖掘 158
8.2.3 预测性挖掘 159
8.3.1 数据挖掘系统的结构 160
8.3 数据挖掘系统 160
8.3.2 数据挖掘系统的设计 161
8.3.3 数据挖掘系统的发展 163
8.4 数据预处理 164
8.4.1 概述 164
8.4.2 数据清理 165
8.4.3 数据集成 166
8.4.4 数据变换 166
8.4.5 数据归约 167
8.4.6 属性概念分层的自动生成 169
8.5 数据挖掘与数据仓库 172
8.6 数据挖掘的应用和发展 172
8.6.1 数据挖掘的应用 172
8.6.2 数据挖掘未来研究方向 174
8.7 本章小结 174
习题 175
第9章 描述性挖掘 176
9.1 特征与比较描述 176
9.1.1 特征与比较描述概述 176
9.1.2 面向属性归纳 177
9.1.3 特征与比较规则 181
9.2 关联规则挖掘 184
9.2.1 关联规则的基本概念 184
9.2.2 Apriori算法 186
9.2.3 FP-growth算法 191
9.3 聚类分析 195
9.3.1 聚类分析的基本概念 195
9.3.2 基于划分的聚类算法 201
9.3.3 基于密度的聚类算法 204
9.4 本章小结 208
习题 208
第10章 分类与预测 210
10.1 决策树分类算法 212
10.1.1 什么是决策树 212
10.1.2 决策树的建立 213
10.1.3 由决策树提取分类规则 218
10.1.4 对新对象分类 219
10.2 神经网络 219
10.2.1 前馈神经网络结构 219
10.2.2 神经网络学习 221
10.2.3 神经网络分类 225
10.3 回归分析 226
10.3.1 一元回归分析 226
10.3.2 多元回归分析 230
10.3.3 非线性回归 231
习题 233
10.4 本章小结 233
第三篇 工具及实例介绍篇 235
第11章 数据仓库工具介绍 235
11.1 数据仓库产品选择 235
11.1.1 数据仓库产品组成 235
11.1.2 数据仓库产品应具备的关键技术 236
11.1.3 数据仓库产品现状 237
11.1.4 如何选取数据仓库工具 237
11.2 常用数据仓库产品简介 238
11.2.1 Oracle 9i 238
11.2.2 NCR TeraData 239
11.2.3 IBM DB2 240
11.2.4 Informix 242
11.3 本章小结 245
习题 245
12.1 Cognos公司BI主要产品介绍 246
第12章 Cognos介绍 246
12.1.1 数据查询和即席报表生成工具 247
12.1.2 模型建立工具 252
12.1.3 在线分析处理及展现工具 257
12.2 Cognos应用例子 259
12.2.1 报表的生成 259
12.2.2 Cube的构造 265
12.3 本章小结 269
习题 269
第13章 移动通信业务数据仓库系统 271
13.1 系统介绍 271
13.1.1 系统建设的原则和目标 271
13.1.2 系统结构和功能 272
13.2 系统模型设计 274
13.2.1 概念模型设计 274
13.2.2 逻辑模型设计 279
13.2.3 物理模型设计(PDM) 283
13.3 数据装载接口设计 286
13.3.1 概述 286
13.3.2 源数据分析 286
13.3.3 ETL 287
13.4 数据仓库的维护 288
13.4.1 数据周期 288
13.4.2 参照完整性 289
13.4.3 数据备份与恢复 289
13.5 前端分析展示 292
13.5.1 概述 292
13.5.2 前端分析展示设计及实现 293
13.5.3 Demo演示 293
13.6 本章小结 297
习题 297
主要参考文献 299