当前位置:首页 > 工业技术
数据仓库与数据挖掘原理及应用
数据仓库与数据挖掘原理及应用

数据仓库与数据挖掘原理及应用PDF电子书下载

工业技术

  • 电子书积分:11 积分如何计算积分?
  • 作 者:王丽珍等编著(云南大学信息学院)
  • 出 版 社:北京:科学出版社
  • 出版年份:2005
  • ISBN:7030156579
  • 页数:300 页
图书介绍:本书主要向读者介绍有关数据仓库方面的一些知识等。
《数据仓库与数据挖掘原理及应用》目录

目录 1

第一篇 数据仓库及OLAP概念、原理和技术篇 1

第1章 数据仓库基本概念 1

1.1 从数据库到数据仓库 1

1.1.1 蜘蛛网问题 1

1.1.2 事务型系统和分析型系统的分离 4

1.2 什么是数据仓库 6

1.2.1 面向主题 6

1.2.2 集成 7

1.2.3 稳定性 8

1.2.4 随时间而变化 9

1.3 数据仓库的体系结构 9

1.3.1 数据仓库的体系结构 9

1.3.2 数据仓库中的关键名词 10

1.4.1 数据仓库的数据组织结构 13

1.4 数据仓库的数据组织 13

1.4.2 数据粒度与数据分割 14

1.4.3 数据仓库的数据组织形式 15

1.4.4 数据仓库的数据追加和清理 17

1.5 本章小结 19

习题 19

2.1 ETL 20

2.1.1 ETL概念 20

第2章 数据仓库中的ETL和元数据 20

2.1.2 ETL作用 23

2.1.3 ETL工具 23

2.2 元数据 26

2.2.1 什么是元数据 27

2.2.2 元数据的标准化 31

2.2.3 数据仓库中的元数据管理 32

2.2.4 在数据仓库项目中使用元数据的建议 34

2.3.1 外部数据和非结构化数据 35

2.3 外部数据 35

2.3.2 元数据和外部数据 36

2.3.3 外部数据的存储 36

2.3.4 外部数据的管理 37

2.4 本章小结 37

习题 38

第3章 数据仓库模型设计 39

3.1 数据仓库模型设计方法概述 39

3.2 数据仓库设计的三级数据模型 40

3.2.1 概念模型 41

3.2.2 逻辑模型 41

3.2.3 物理模型 41

3.2.4 三种模型之间的关系 41

3.2.5 高级模型、中级模型和低级模型 42

3.3.1 E-R模型 43

3.3 数据仓库的概念模型设计 43

3.3.2 面向对象的分析方法 46

3.4 数据仓库的逻辑模型设计 48

3.4.1 分析主题,确定当前要装载的主题 48

3.4.2 确定数据粒度的选择 49

3.4.3 确定数据分割策略 53

3.4.4 增加导出字段 54

3.4.5 定义关系模式 54

3.4.6 定义记录系统 55

3.5 数据仓库的物理模型设计 55

3.5.1 存储结构 55

3.5.2 索引策略 59

3.5.3 数据存储策略 65

3.5.4 存储分配优化 67

3.6 数据装载接口设计 68

习题 69

3.7 本章小结 69

第4章 数据仓库的建立和维护 71

4.1 数据仓库的投资分析 71

4.1.1 建设数据仓库的必要性 71

4.1.2 数据仓库的投资回报分析 72

4.2 数据仓库的开发方法 73

4.2.1 瀑布式开发 73

4.2.2 螺旋式开发 74

4.3 数据仓库的建立过程 74

4.3.1 需求分析 75

4.3.2 数据路线 76

4.3.3 技术路线 77

4.3.4 应用路线 81

4.3.5 数据仓库部署 87

4.4.1 数据周期 88

4.4 数据仓库的维护 88

4.3.6 运行维护 88

4.4.2 参照完整性 89

4.4.3 数据环境信息 90

4.4.4 数据备份与恢复 91

4.5 提高数据仓库性能 92

4.5.1 提高I/O性能 92

4.5.2 缩小查询范围 93

4.5.3 采取并行优化技术 93

4.5.4 选择适当的初始化参数 95

4.6 数据仓库的安全性 95

4.6.1 安全类型 96

4.6.2 安全方法 96

4.7 本章小结 100

习题 101

5.1 什么是数据集市 102

第5章 数据仓库与数据集市的关系 102

5.2 数据集市的类型 103

5.3 数据集市与数据仓库的区别 104

5.4 数据集市的特点 105

5.5 数据集市的开发方法 106

5.6 数据集市的建立 107

5.7 本章小结 108

习题 108

第6章 联机分析处理(OLAP) 109

6.1 OLAP概念 109

6.1.1 什么是OLAP 109

6.1.2 OLAP的相关基本概念 109

6.1.3 OLAP和OLTP的区别 110

6.2 OLAP的基本操作 111

6.2.1 数据切片 111

6.2.3 数据上探/下钻 113

6.2.2 数据切块 113

6.2.4 数据旋转 114

6.3 OLAP分类和体系结构 115

6.3.1 OLAP的三层客户/服务器结构 115

6.3.2 OLAP的分类 115

6.3.3 OLAP的体系结构 116

6.4 基于多维数据库的OLAP(MOLAP) 118

6.4.1 多维数据库 118

6.4.2 维的分类 119

6.4.3 多维数据库存储 121

6.5 基于关系数据库的OLAP(ROLAP) 121

6.5.1 维表和事实表 121

6.5.2 星型模型和雪花模型 125

6.5.3 星座模型和雪暴模型 127

6.5.4 ROLAP与MOLAP比较 129

6.5.5 HOLAP 131

6.6 OLAP的衡量和特性 132

6.6.1 OLAP的12准则 132

6.6.2 OLAP的简洁准则(OLAP的特性) 135

6.7 OLAP的前端展现方式 136

6.7.1 OLAP实现架构 136

6.7.2 OLAP的Web呈现方式 137

6.7.3 瘦客户机方式 137

6.7.4 OLAP的前端展现 137

6.8 OLAP的发展及展望 140

6.8.1 OLAP在应用领域的发展趋势 140

6.8.2 OLAP基于Web的应用 142

6.8.3 OLAP展望 142

6.9 本章小结 143

习题 143

7.1 在电信业的应用前景 144

第7章 数据仓库的应用前景 144

7.2 在客户服务及营销方面的应用前景 146

7.3 在银行领域的应用前景 147

7.4 在保险业的应用前景 148

7.5 在图书馆领域的应用前景 148

7.6 成功案例分析 149

7.7 本章小结 154

习题 154

第二篇 数据挖掘技术篇 155

第8章 数据挖掘介绍 155

8.1 数据挖掘概述 155

8.2 数据挖掘分类 157

8.2.1 概述 157

8.2.2 描述性挖掘 158

8.2.3 预测性挖掘 159

8.3.1 数据挖掘系统的结构 160

8.3 数据挖掘系统 160

8.3.2 数据挖掘系统的设计 161

8.3.3 数据挖掘系统的发展 163

8.4 数据预处理 164

8.4.1 概述 164

8.4.2 数据清理 165

8.4.3 数据集成 166

8.4.4 数据变换 166

8.4.5 数据归约 167

8.4.6 属性概念分层的自动生成 169

8.5 数据挖掘与数据仓库 172

8.6 数据挖掘的应用和发展 172

8.6.1 数据挖掘的应用 172

8.6.2 数据挖掘未来研究方向 174

8.7 本章小结 174

习题 175

第9章 描述性挖掘 176

9.1 特征与比较描述 176

9.1.1 特征与比较描述概述 176

9.1.2 面向属性归纳 177

9.1.3 特征与比较规则 181

9.2 关联规则挖掘 184

9.2.1 关联规则的基本概念 184

9.2.2 Apriori算法 186

9.2.3 FP-growth算法 191

9.3 聚类分析 195

9.3.1 聚类分析的基本概念 195

9.3.2 基于划分的聚类算法 201

9.3.3 基于密度的聚类算法 204

9.4 本章小结 208

习题 208

第10章 分类与预测 210

10.1 决策树分类算法 212

10.1.1 什么是决策树 212

10.1.2 决策树的建立 213

10.1.3 由决策树提取分类规则 218

10.1.4 对新对象分类 219

10.2 神经网络 219

10.2.1 前馈神经网络结构 219

10.2.2 神经网络学习 221

10.2.3 神经网络分类 225

10.3 回归分析 226

10.3.1 一元回归分析 226

10.3.2 多元回归分析 230

10.3.3 非线性回归 231

习题 233

10.4 本章小结 233

第三篇 工具及实例介绍篇 235

第11章 数据仓库工具介绍 235

11.1 数据仓库产品选择 235

11.1.1 数据仓库产品组成 235

11.1.2 数据仓库产品应具备的关键技术 236

11.1.3 数据仓库产品现状 237

11.1.4 如何选取数据仓库工具 237

11.2 常用数据仓库产品简介 238

11.2.1 Oracle 9i 238

11.2.2 NCR TeraData 239

11.2.3 IBM DB2 240

11.2.4 Informix 242

11.3 本章小结 245

习题 245

12.1 Cognos公司BI主要产品介绍 246

第12章 Cognos介绍 246

12.1.1 数据查询和即席报表生成工具 247

12.1.2 模型建立工具 252

12.1.3 在线分析处理及展现工具 257

12.2 Cognos应用例子 259

12.2.1 报表的生成 259

12.2.2 Cube的构造 265

12.3 本章小结 269

习题 269

第13章 移动通信业务数据仓库系统 271

13.1 系统介绍 271

13.1.1 系统建设的原则和目标 271

13.1.2 系统结构和功能 272

13.2 系统模型设计 274

13.2.1 概念模型设计 274

13.2.2 逻辑模型设计 279

13.2.3 物理模型设计(PDM) 283

13.3 数据装载接口设计 286

13.3.1 概述 286

13.3.2 源数据分析 286

13.3.3 ETL 287

13.4 数据仓库的维护 288

13.4.1 数据周期 288

13.4.2 参照完整性 289

13.4.3 数据备份与恢复 289

13.5 前端分析展示 292

13.5.1 概述 292

13.5.2 前端分析展示设计及实现 293

13.5.3 Demo演示 293

13.6 本章小结 297

习题 297

主要参考文献 299

相关图书
作者其它书籍
返回顶部