第1章 数据仓库导论 1
1.1 数据仓库的发展及展望 2
1.1.1 从传统数据库到数据仓库 2
1.1.2 数据仓库的定义与基本特性 5
1.1.3 数据仓库的几个重要概念 8
1.1.4 数据仓库的未来发展 10
1.2 数据仓库的应用 12
1.2.1 数据仓库的两类用户——信息的使用者与知识的挖掘者 12
1.2.3 知识挖掘者的数据仓库应用 13
1.2.2 信息使用者的数据仓库应用 13
1.3 数据仓库总体结构 15
1.3.1 数据仓库的总体参考框架 16
1.3.2 数据仓库基本功能层 16
1.3.3 数据仓库的管理层 24
1.3.4 数据仓库的元数据管理层 25
1.3.5 数据仓库的环境支持层 26
1.4 数据仓库技术 28
本章小结 31
习题 31
第2章 Oracle的数据仓库设计与使用 33
2.1.1 Oracle数据仓库的技术基础工具 34
2.1 Oracle数据仓库开发工具简介 34
2.1.2 Oracle数据仓库的分析应用工具 35
2.1.3 Oracle数据仓库创建工具 36
2.1.4 Oracle数据仓库维护工具 36
2.2 Oracle数据仓库创建 36
2.2.1 Oracle数据仓库的创建 36
2.2.2 Oracle数据仓库表空间的创建 43
2.2.3 Oracle数据仓库表的创建 48
2.3.1 Oracle数据仓库的维创建 56
2.3 Oracle数据仓库的维与立方创建 56
2.3.2 Oracle数据仓库的立方创建 62
2.4 Oracle数据仓库的应用工具简介 67
2.4.1 Oracle数据仓库的OLAP应用 67
2.4.2 Oracle数据仓库的数据挖掘应用 68
本章小结 70
习题 71
第3章 SQL Server的数据仓库设计与使用 73
3.1 SQL Server数据仓库开发工具及应用 74
3.2.1 创建数据库 76
3.2 SQL Server的数据仓库创建 76
3.2.2 创建表 77
3.3 SQL Server中的数据仓库访问与操纵 79
3.3.1 Analysis Manager数据库的创建与数据源的确定 79
3.3.2 用Analysis Services创建维 82
3.3.3 用Analysis Services创建多维数据集 86
3.3.4 用查询分析器(Transact-SQL)访问数据仓库 92
3.3.5 用Microsoft English Query操纵数据仓库 92
3.4.1 SQL Server的数据复制工具与应用 95
3.4 SQL Server中的数据提取与加载 95
3.4.2 DTS的数据导出工具(DTS Export Wizard) 98
3.4.3 DTS的数据导入工具(DTS Import Wizard) 101
3.4.4 DTS的数据转换 103
3.5 SQL Server中的数据挖掘工具与应用 104
3.5.1 SQL Server中的数据挖掘工具 104
3.5.2 决策类数据挖掘工具的应用 105
3.5.3 聚类分析的数据挖掘工具应用 110
本章小结 113
习题 114
第4章 Delphi中的数据仓库设计与使用 115
4.1 Delphi 简介 116
4.1.1 Delphi的开发集成环境组成 116
4.1.2 Delphi的菜单栏与应用 117
4.1.3 Delphi的工具栏与应用 117
4.1.4 Delphi的组件板与应用 117
4.1.5 Delphi的对象检查器与应用 118
4.1.6 Delphi的窗体与应用 118
4.1.7 Delphi的代码编辑器与应用 118
4.1.8 Delphi应用程序的设计过程 119
4.2 Delphi中的数据仓库组件 121
4.3 DecisionQuery组件 122
4.3.1 DecisionQuery组件的主要属性 122
4.3.2 DecisionQuery组件的主要方法 124
4.3.3 DecisionQuery组件的主要事件 124
4.3.4 利用DecisionQuery组件选择需要分析的数据维 125
4.3.5 利用DecisionQuery组件选择数据的分析公式 126
4.4 DecisionCube与DecisionSource组件 126
4.4.1 DecisionCube组件的主要属性 127
4.4.3 DecisionCube组件的主要事件 129
4.4.2 DecisionCube组件的主要方法 129
4.4.4 DecisionSource组件的主要属性 130
4.4.5 DecisionSource组件的主要方法 131
4.4.6 DecisionSource组件的主要事件 131
4.5 DecisionPivot组件、DecisionGrid组件与DecisionGraph组件 132
4.5.1 DecisionPivot组件的主要属性 132
4.5.2 DecisionPivot组件的主要方法 132
4.5.3 DecisionPivot组件的主要事件 133
4.5.4 DecisionGrid组件的主要属性 133
4.5.7 DecisionGraph组件的主要属性 134
4.5.5 DecisionGrid组件的主要方法 134
4.5.6 DecisionGrid组件的主要事件 134
4.5.8 DecisionGraph组件的主要方法 140
4.5.9 DecisionGraph组件的主要事件 141
本章小结 141
习题 141
案例4.1 141
第5章 数据仓库开发模型 145
5.1 数据仓库的各种数据模型 146
5.2.1 概念数据模型 147
5.2 数据仓库概念模型 147
5.2.2 规范的数据模型 150
5.2.3 星型模型 152
5.2.4 雪花模型 153
5.3 中间层逻辑模型 154
5.4 物理数据模型 155
5.4.1 事实表模型设计 156
5.4.2 维模型设计 157
5.4.3 数据仓库物理数据模型的性能问题 157
5.5.1 元数据的类型与组成 159
5.5 元数据模型 159
5.5.2 元数据在数据仓库中的作用 161
5.5.3 元数据的收集 164
5.5.4 元数据的存储、管理与维护 166
5.5.5 元数据的用户与使用方法 168
5.5.6 元数据管理模型 170
5.6 数据仓库的粒度模型 170
5.6.1 数据粒度的划分 171
5.6.2 确定粒度的级别 172
习题 173
本章小结 173
第6章 数据仓库开发应用的阶段 175
6.1 数据仓库的生命周期 176
6.1.1 数据仓库的阶段性 176
6.1.2 数据仓库的螺旋式开发方法 177
6.1.3 数据仓库的开发特点 178
6.2 数据仓库的规划 179
6.2.1 选择数据仓库实现策略 180
6.2.2 确定数据仓库的开发目标和实现范围 181
6.2.3 数据仓库的结构 182
6.2.4 数据仓库使用方案和项目规划预算 184
6.3 数据仓库的需求定义 185
6.3.1 定义业主的需求 185
6.3.2 定义设计者的需求 185
6.3.3 开发者的需求定义 186
6.3.4 最终用户的需求定义 188
6.3.5 数据仓库的数据模型设计 189
6.4 数据仓库的设计和实施阶段 189
6.4.2 数据仓库的体系结构与数据库设计 190
6.4.1 数据仓库的数据源确定以及与业务处理系统接口的设计 190
6.4.3 数据仓库的中间件设计 192
6.4.4 数据仓库的数据抽取 193
6.4.5 数据仓库的数据加载 194
6.4.6 数据仓库数据的复制与发行 194
6.4.7 数据仓库的测试 195
6.5 数据仓库的使用、支持和增强阶段 196
6.5.1 数据仓库的用户培训及支持 196
6.5.2 数据仓库的使用方式 197
6.5.3 数据仓库使用中的数据刷新 198
6.5.4 数据仓库的增强 199
本章小结 201
习题 201
第7章 数据仓库的开发过程 203
7.1 数据仓库的概念模型设计 204
7.1.1 概念模型的需求调查 204
7.1.2 概念模型的定义 205
7.1.3 概念模型的分析 209
7.1.4 概念模型的设计 210
7.1.5 概念模型文档与评审 212
7.2 数据仓库的逻辑模型设计 213
7.2.1 分析主题域 213
7.2.2 粒度层次的划分 214
7.2.3 确定数据分割策略 215
7.2.4 关系模型定义 216
7.2.5 数据仓库的实体定义 216
7.2.6 数据仓库的数据抽取模型 217
7.2.7 逻辑模型的评审 219
7.3.2 确定数据结构的类型 220
7.3.1 数据仓库设计的规范 220
7.3 数据仓库物理模型的设计 220
7.3.3 确定索引策略 221
7.3.4 确定数据存放位置 222
7.3.5 确定存储分配 223
7.3.6 数据仓库物理模型的评审 224
7.4 数据仓库的运行技术管理 226
7.4.1 数据加载的一些问题 226
7.4.2 故障恢复管理 227
7.4.3 访问控制与安全管理 227
7.4.4 数据增长的管理 228
本章小结 230
习题 230
第8章 OLAP技术 231
8.1 OLAP技术基本概念 232
8.1.1 OLAP的发展 232
8.1.2 OLAP的特性 233
8.2 OLAP与多维分析 233
8.2.1 几个基本概念 233
8.2.2 多维分析 236
8.2.3 维的层次关系 237
8.2.4 维的类关系 238
8.2.5 OLAP与数据仓库关系 239
8.3 OLAP的实施 240
8.4 基于多维的OLAP 241
8.4.1 多维数据库 241
8.4.2 多维数据库的数据存储 242
8.4.3 多维数据库与数据仓库 243
8.5 关系OLAP 244
8.5.2 ROLAP的多维表示方法 245
8.5.1 ROLAP的三个规则 245
8.6 OLAP的选择与评价标准 248
8.6.1 MOLAP与ROLAP的比较 248
8.6.2 OLAP的衡量标准 250
8.6.3 OLAP服务器和工具的评价标准 253
本章小结 255
习题 255
第9章 数据挖掘技术导论 257
9.1 数据挖掘概述 258
9.1.1 数据挖掘的发展 258
9.1.2 数据挖掘的定义 259
9.1.3 数据挖掘与数据仓库关系 261
9.2 数据挖掘技术与数据挖掘工具 262
9.2.1 常用数据挖掘技术 262
9.2.2 常用数据挖掘工具 265
9.2.3 数据挖掘工具的评价标准 266
9.2.4 常用数据挖掘工具的选择 268
9.3 数据挖掘技术的应用过程 269
9.3.1 数据挖掘过程 269
9.4 数据挖掘的应用范围 274
9.3.2 数据挖掘的用户 274
9.4.1 客户的细分应用 276
9.4.2 客户盈利能力分析 277
9.4.3 客户的获取与保持分析 279
9.4.4 市场营销中的应用 280
9.4.5 数据挖掘的其他应用 281
本章小结 282
习题 283
第10章 统计类数据挖掘技术 285
10.1.1 统计与统计类数据挖掘技术 286
10.1 统计分析类数据挖掘技术 286
10.1.2 数据的聚集与度量技术 287
10.1.3 柱状图数据挖掘技术 287
10.1.4 线性回归数据挖掘技术 288
10.1.5 非线性回归数据挖掘技术 290
10.1.6 聚类数据挖掘技术 292
10.1.7 最近邻数据挖掘技术 295
10.2 统计分析类工具 297
10.2.1 统计类数据挖掘工具与商业分析员 297
10.2.2 统计类数据挖掘工具的功能 298
10.2.3 统计类数据挖掘工具——SPSS 299
10.3 统计分析类工具的用途 302
10.3.1 趋势分析 302
10.3.2 时序分析 303
10.3.3 周期分析 304
10.4 统计分析类工具应用中的问题 305
10.4.1 统计类数据挖掘的预处理问题 305
10.4.2 统计分析遵循的基本原则 307
10.4.3 统计分析的步骤 308
10.4.4 统计类数据挖掘的性能问题 309
本章小结 310
习题 310
第11章 知识类数据挖掘技术 313
11.1 知识发现系统的一般结构 314
11.1.1 知识发现的定义 314
11.1.2 知识发现系统的结构 315
11.2 知识发现技术 317
11.2.1 规则型知识挖掘技术 317
11.2.2 神经网络型知识挖掘技术 319
11.2.3 遗传算法型知识挖掘技术 321
11.2.4 粗糙集型知识挖掘技术 324
11.3 知识发现技术的运用 325
11.3.1 关联规则的应用 325
11.3.2 神经网络的应用 327
11.3.3 遗传算法的应用 328
11.3.4 粗糙集的应用 330
11.4 知识发现工具的应用 332
11.4.1 知识发现工具的系统结构 332
11.4.2 知识发现工具运用中的问题 334
11.4.3 知识发现的价值 336
11.4.4 知识类数据挖掘工具简介 337
本章小结 338
习题 339
第12章 其他数据挖掘技术和工具 341
12.1 文本挖掘技术 342
12.1.1 信息检索系统 342
12.1.2 文本分析和语义网络 344
12.1.3 文本挖掘 345
12.2.1 Web的特点 348
12.2 Web挖掘技术 348
12.2.2 Web内容挖掘 349
12.2.3 Web结构挖掘 350
12.2.4 Web使用记录的挖掘 352
12.2.5 Web数据挖掘的应用 353
12.3 分类分析技术 354
12.4 可视化数据挖掘技术 359
12.4.1 数据可视化技术 359
12.4.2 可视化数据挖掘技术 360
12.5.1 地理信息系统 363
12.5 地理信息系统与空间数据挖掘 363
12.5.2 空间数据挖掘 365
12.6 分布式数据挖掘 366
12.6.1 概述 366
12.6.2 适合水平式数据划分的分布式挖掘方法 367
12.6.3 适合垂直式数据划分的分布式挖掘方法 368
本章小结 369
习题 370
第13章 数据仓库的应用与管理 371
13.1.1 分层决策体系 372
13.1 数据仓库在信息管理中的实际应用 372
13.1.2 数据抽样分析 375
13.1.3 发挥历史数据的经济效益 376
13.1.4 回扣分析 377
13.1.5 客户关系管理 378
13.2 数据仓库应用与数据挖掘中的法律问题 379
13.2.1 数据的隐私权问题 380
13.2.2 数据隐私权的处理 380
13.3 数据仓库开发与应用的成本/效益分析 383
13.3.1 数据仓库投资回报的定量分析 383
13.3.2 数据仓库投资回报的定性分析 384
13.4 数据仓库的开发与运行管理 385
13.4.1 数据仓库开发与应用的组织结构 386
13.4.2 数据仓库的项目开发管理 388
13.4.3 数据仓库应用的阶段性 393
13.4.4 数据仓库的运行管理 396
13.4.5 数据仓库的评价 398
本章小结 400
习题 400
参考文献 403