《数据仓库原理、设计与应用》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:陈京民编著
  • 出 版 社:北京:中国水利水电出版社
  • 出版年份:2004
  • ISBN:750842042X
  • 页数:296 页
图书介绍:本书全面系统地介绍了数据仓库、联机分析处理和数据挖掘的基本概念、原理、开发和应用技术。包含数据仓库、联机分析处理和数据挖掘的基本概念、体系结构、开发模型、项目规划、创建过程和应用管理,涵盖了数据仓库的完整生命周期。本书力求从务实的角度出发,揭开笼罩在数据仓库、联机分析处理和数据挖掘上面的神秘面纱,使读者能对数据仓库、联机分析处理和数据挖掘有一正确认识,以推动数据仓库在我国的健康发展。本书适合于企业各个层次的管理人员、项目开发人员,也可作为相关专业本科生和研究生的教材。

目录 1

前言 1

第1章 数据仓库与数据挖掘概述 1

1.1 数据仓库的发展与展望 1

1.1.1 从传统数据库到数据仓库 1

1.1.2 数据仓库的定义与基本特性 3

1.1.3 数据仓库的未来发展 7

1.2 数据仓库的体系结构 8

1.2.1 数据仓库的概念结构 8

1.2.2 虚拟数据仓库结构 8

1.2.3 数据集市结构 9

1.2.4 单一数据仓库结构 9

1.2.5 分布式数据仓库结构 10

1.3 数据仓库的参照结构 11

1.3.1 数据仓库基本功能层 11

1.3.2 数据仓库的管理层 18

1.3.3 数据仓库的元数据管理层 19

1.3.4 数据仓库的环境支持层 20

1.4 数据挖掘技术概述 21

1.4.1 数据挖掘的发展 21

1.4.2 数据挖掘的定义 22

1.5 数据挖掘技术与工具 24

1.5.1 常用的数据挖掘技术 24

1.5.2 常用数据挖掘工具 26

1.5.3 数据挖掘工具的评价标准 28

1.5.4 常用数据挖掘工具的选择 29

1.6.1 数据挖掘与数据仓库 30

1.6 数据挖掘的应用 30

1.6.2 数据挖掘过程 31

1.6.3 数据挖掘的用户 35

第2章 数据仓库开发模型 36

2.1 数据仓库开发模型概述 36

2.2 数据仓库概念模型 37

2.2.1 概念数据模型 37

2.2.2 规范的数据模型 40

2.2.3 星型模型 41

2.2.4 雪花模型 43

2.3 数据仓库的逻辑模型 43

2.3.1 事实表模型设计 45

2.4.1 数据仓库物理模型的存储结构 47

2.4 数据仓库的物理模型 47

2.3.2 维模型设计 47

2.4.2 数据仓库物理模型的索引构建 48

2.4.3 数据仓库物理模型的优化问题 52

2.5 数据仓库的元数据模型 53

2.5.1 元数据的类型与组成 53

2.5.2 元数据在数据仓库中的作用 55

2.5.3 元数据的收集 58

2.6 数据仓库的粒度和聚集模型 59

2.6.1 数据粒度的划分 60

2.6.2 确定粒度的级别 61

2.6.3 数据仓库的聚集模型确定 62

2.6.4 聚集模型的处理 62

2.6.5 聚集模型的管理 63

3.1 数据仓库开发应用的特点 64

3.1.1 数据仓库开发应用的阶段性 64

第3章 数据仓库开发应用过程 64

3.1.2 数据仓库的螺旋式开发方法 65

3.1.3 数据仓库的开发特点 66

3.2 数据仓库的规划 67

3.2.1 选择数据仓库的实现策略 67

3.2.2 确定数据仓库的开发目标和实现范围 68

3.2.3 数据仓库的结构 70

3.2.4 数据仓库使用方案和项目规划预算 71

3.3 数据仓库的概念模型设计 72

3.3.1 概念模型的需求调查 72

3.3.2 概念模型的定义 73

3.3.3 概念模型的分析 76

3.3.4 概念模型的设计 77

3.3.5 概念模型文档与评审 79

3.4 数据仓库的逻辑模型设计 80

3.4.1 分析主题域 81

3.4.2 粒度层次和聚集的确定 82

3.4.3 确定数据分割策略 82

3.4.4 关系模型定义 83

3.4.5 数据仓库的实体定义 83

3.4.6 数据仓库的数据抽取模型 84

3.4.7 数据仓库元数据模型的建立与应用 89

3.4.8 逻辑模型的评审 90

3.5 数据仓库的物理模型设计 91

3.5.1 数据仓库设计的规范 91

3.5.2 确定数据结构的类型 92

3.5.3 数据仓库索引的创建 93

3.5.5 确定存储分配 94

3.5.4 确定数据的存放位置 94

3.5.6 数据仓库物理模型的评审 95

3.6 数据仓库的实施 96

3.6.1 数据仓库与业务处理系统接口的设计 97

3.6.2 数据仓库的创建 97

3.6.3 数据仓库的数据加载、复制与发行 98

3.6.4 数据仓库的中间件设计 99

3.6.5 数据仓库的测试 99

3.7 数据仓库的应用、支持和增强 100

3.7.1 数据仓库的用户培训及支持 100

3.7.2 数据仓库的使用方式 101

3.7.3 数据仓库使用中的数据刷新 102

3.7.4 数据仓库的增强 103

4.1.1 OLAP的发展 105

4.1.2 OLAP的特性 105

4.1 OLAP技术概述 105

第4章 OLAP技术 105

4.2 OLAP与多维分析 106

4.2.1 多维基本概念 106

4.2.2 多维分析 109

4.2.3 维的层次关系 111

4.2.4 维的类关系 111

4.2.5 OLAP与数据仓库的关系 112

4.3 OLAP的实施 113

4.4 多维OLAP与关系OLAP 114

4.4.1 多维数据库 114

4.4.2 多维数据库的数据存储 116

4.4.3 多维数据库与数据仓库 116

4.4.4 MOLAP的创建与功能 117

4.4.5 ROLAP实现的三个规则 118

4.4.6 ROLAP的多维表示方法 119

4.4.7 ROLAP的创建与功能 121

4.5 OLAP技术评价 122

4.5.1 MOLAP与ROLAP的比较 122

4.5.2 OLAP的衡量标准 124

4.5.3 OLAP服务器和工具的评价标准 126

第5章 传统数据挖掘技术 128

5.1 传统的统计分析类数据挖掘技术 128

5.1.1 统计与统计类数据挖掘技术 128

5.1.2 数据的聚集与度量技术 129

5.1.3 柱状图数据挖掘技术 129

5.1.4 线性回归数据挖掘技术 131

5.1.6 聚类数据挖掘技术 133

5.1.5 非线性回归数据挖掘技术 133

5.1.7 最近邻数据挖掘技术 140

5.2 统计分析类工具 141

5.2.1 统计类数据挖掘工具 141

5.2.2 统计类数据挖掘的商业分析 142

5.2.3 统计类数据挖掘工具的功能 142

5.2.4 统计类数据挖掘工具——SPSS 143

5.3 统计分析类工具的应用 146

5.3.1 趋势分析 146

5.3.2 时序分析 147

5.3.3 周期分析 147

5.4 统计分析类工具应用的问题 148

5.4.1 统计类数据挖掘的预处理问题 148

5.4.2 统计分析应遵循的基本原则 150

5.4.4 统计类数据挖掘的性能问题 151

5.4.3 统计分析的步骤 151

第6章 现代数据挖掘技术与发展 153

6.1 知识挖掘系统的体系结构 153

6.1.1 知识发现的定义 153

6.1.2 知识发现系统的结构 154

6.2 现代挖掘技术及应用 156

6.2.1 规则型现代挖掘技术及应用 156

6.2.2 神经网络型现代挖掘技术 161

6.2.3 遗传算法型现代挖掘技术 166

6.2.4 粗糙集型现代挖掘技术 170

6.2.5 决策树型现代挖掘技术 172

6.3 知识发现的工具与应用 175

6.3.1 知识挖掘工具的系统结构 175

6.3.2 知识挖掘工具运用中的问题 177

6.3.3 知识挖掘的价值 179

6.3.4 现代数据挖掘工具简介 180

6.4 数据挖掘技术的发展 181

6.4.1 文本挖掘 181

6.4.2 Web挖掘技术 183

6.4.3 可视化数据挖掘技术 186

6.4.4 空间数据挖掘 187

6.4.5 分布式数据挖掘 190

第7章 数据仓库的应用与管理 193

7.1 数据仓库的用户 193

7.1.1 数据仓库的用户——信息的使用者与知识的挖掘者 193

7.1.2 信息使用者的数据仓库使用方式 193

7.1.3 知识挖掘者的数据仓库使用方式 194

7.2.1 分层决策体系 195

7.2 数据仓库应用案例 195

7.2.2 数据抽样分析 197

7.2.3 发挥历史数据的经济效益 198

7.2.4 回扣分析 199

7.2.5 客户关系管理 199

7.3 数据仓库的运行技术管理 200

7.3.1 数据加载的一些问题 200

7.3.2 故障恢复管理 201

7.3.3 访问控制与安全管理 201

7.3.4 数据增长的管理 202

7.4 数据仓库的元数据管理 203

7.4.1 元数据的存储、管理与维护 203

7.4.2 元数据的用户与使用方法 204

7.4.3 元数据管理模型 206

7.5 数据仓库应用中的法律问题 208

7.5.1 数据的隐私权问题 209

7.5.2 数据隐私权的处理 209

7.6 数据仓库的成本与效益分析 211

7.6.1 数据仓库的投资回报的定量分析 211

7.6.2 数据仓库的投资回报的定性分析 212

第8章 数据仓库开发实例 214

8.1 超市销售数据仓库的规划与分析 214

8.1.1 超市销售数据仓库的需求分析 214

8.1.2 超市销售数据仓库E-R模型的构造 215

8.1.3 超市数据仓库事实表模型 216

8.1.4 超市数据仓库维表模型设计 218

8.1.5 超市数据仓库模型的关键字设计 223

8.1.6 超市数据仓库的元数据设计 225

8.2.1 数据仓库开发工具 228

8.2 数据仓库开发工具简介 228

8.2.2 SQL Server数据仓库开发应用工具 230

8.3 SQL Server的数据仓库创建 232

8.3.1 创建数据库 233

8.3.2 创建表 234

8.4 SQL Server数据仓库事实表与多维数据集的建立 235

8.4.1 Analysis Manager数据库的创建与数据源确定 235

8.4.2 SQL Server数据仓库的维创建 239

8.4.3 SQL Server的多维数据集创建 246

第9章 数据仓库应用实例 253

9.1 数据仓库的数据加载与钻取 253

9.1.1 数据仓库的数据加载 253

9.1.2 超市数据仓库系统的数据加载 256

9.1.3 多维数据集的更新 262

9.1.4 数据仓库的钻取访问 267

9.1.5 数据仓库的多维表达式MDX应用 270

9.2 数据挖掘模型的设计 272

9.2.1 数据挖掘对象的分析 272

9.2.2 数据挖掘模型与相关数据的准备 273

9.2.3 数据挖掘模型的应用 276

9.3 SQL Server中的数据挖掘工具 276

9.3.1 决策类数据挖掘工具的应用 277

9.3.2 聚类分析数据挖掘工具的应用 282

9.4 数据仓库客户端界面的设计 287

9.4.1 客户端界面展现内容的设计 287

9.4.2 客户端界面展现工具的选择 288

9.4.3 Excel展现界面的实现 289

参考文献 294