《数据仓库技术与实现》PDF下载

  • 购买积分:14 如何计算积分?
  • 作  者:彭木根编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2002
  • ISBN:7505376225
  • 页数:430 页
图书介绍:本书首先详细介绍了数据仓库技术的理论和实现方法,然后详细阐述数据仓库的解决方案,并通过实例阐述了如何创建、管理和维护数据仓库。

第1章 从数据库到数据仓库 3

1.1 数据仓库的由来 4

1.2 数据仓库的定义 5

1.2.1 数据仓库的基本定义 5

1.2.2 数据仓库从数据库进化而来 7

1.2.3 数据仓库与传统数据库的区别 8

1.3 数据仓库的体系化环境 12

1.3.1 数据仓库的结构 12

1.3.3 数据仓库的实现 14

1.3.2 多层数据仓库的体系结构 14

1.4 数据仓库中的数据组织 15

1.4.1 粒度与分割 16

1.4.2 元数据 17

1.4.3 数据概念模型 17

1.4.4 数据仓库的数据组织方式 18

1.4.5 数据仓库的数据追加 19

1.4.6 “维表—事实表”构成的关系型数据仓库 19

1.4.7 OLAP的数据组织 21

1.5 数据仓库的方法论 22

1.5.1 任务和环境的评估 22

1.5.2 需求的收集和分析 22

1.5.3 构造数据仓库 23

1.5.4 数据仓库技术的培训 23

1.5.5 回顾、总结再发展 24

1.6 数据仓库工程规划 24

1.6.1 工程规划的重要性 24

1.6.2 制定数据仓库工程规划的过程 25

1.6.3 数据仓库工程规划文档的内容 27

1.6.4 数据仓库体系结构 28

1.7 发展阶段 30

1.8 小结 31

第2章 数据仓库的基本组成 33

2.1 元数据 34

2.1.1 概念 34

2.1.2 元数据的管理功能 36

2.1.3 元数据的标准化和商品化 39

2.2 关系数据库 40

2.2.1 创建和维护数据库概述 40

2.2.2 数据库性能优化概述 41

2.3 数据集市 41

2.4 数据源 42

2.5 维度 43

2.5.1 概述 43

2.5.2 维度层次结构 46

2.5.3 维度特征 48

2.5.4 维度类型 49

2.6 级别和成员 51

2.6.1 “全部”级别和全部成员 52

2.6.2 数据成员 53

2.7 度量值 53

2.8 单元 54

2.8.1 计算单元 55

2.9 多维数据集 56

2.9.1 多维数据集结构 57

2.9.2 多维数据集存储 58

2.9.3 多维数据集处理 58

2.9.4 多维数据集类型 58

2.10 分区和聚合 61

2.10.1 分区 61

2.10.2 分区结构 63

2.10.3 分区存储 63

2.10.4 聚合 64

2.11 成员属性 65

2.12 小结 67

第3章 ODS 69

3.1 ODS的由来与定义 70

3.1.1 由来 70

3.1.2 定义 70

3.1.3 与数据仓库的联系与区别 71

3.2 DB―ODS―DW的体系结构 71

3.3.1 ODS数据模式的形成 73

3.3.2 获取并传输数据 73

3.3 创建ODS 73

3.3.3 从DB向ODS转化的实现机制 74

3.4 实例分析 75

3.4.1 问题的提出 75

3.4.2 技术选型 76

3.4.3 基于ODS药品销售的即时OLAP应用设计 76

3.4.4 数据采集 77

3.4.6 系统的体系结构 78

3.5 小结 78

3.4.5 系统用户界面的实现 78

第4章 OLAP系统 81

4.1 概述 82

4.1.1 由来与定义 82

4.1.2 WebOLAP 84

4.1.3 OLAP+数据挖掘 85

4.2 OLAP的多维数据概念 85

4.2.1 维 85

4.2.2 多维性 86

4.3.1 OLAP结构 88

4.3 OLAP的多维数据结构 88

4.3.2 活动数据的存储 90

4.4 OLAP数据的处理方式 91

4.5 多维数据库 91

4.6 OLAP的实现方式 92

4.6.1 实现中的问题及对策 92

4.6.2 实现技术 95

4.7 OLAP和OLTP的区别 97

4.8.2 体系结构 99

4.8.1 由来 99

4.8 OLAP的新发展——OLAM 99

4.8.3 功能特征 100

4.8.4 OLAM领域的主要发展方向 101

4.9 小结 102

第5章 数据挖掘技术概述 103

5.1 概述 104

5.2 数据挖掘的定义 106

5.2.2 数据挖掘与传统分析方法的区别 107

5.2.1 商业角度的定义 107

5.3 数据挖掘过程 108

5.3.1 工作量 109

5.3.2 过程 109

5.3.3 所需人员 110

5.3.4 5A模型 111

5.3.5 数据挖掘过程模型CRISP-DM 112

5.4 数据挖掘的研究内容及其方法 114

5.4.1 概述 114

5.4.2 数据挖掘的任务及其6种模式 120

5.4.3 关联规则挖掘的常用算法 124

5.4.4 决策树方法 128

5.4.5 粗集方法 129

5.5 Web数据挖掘 131

5.5.1 Web数据挖掘的难点 132

5.5.2 发现序列互信息 133

5.5.3 发现互信息规则 134

5.5.4 发现相关主题域 135

5.5.5 检验规则的有效性 136

5.6.1 Sample──数据取样 137

5.6 数据挖掘方法论 137

5.6.2 Explore──数据特征探索、分析和预处理 138

5.6.3 Modify──问题明确化、数据调整和技术选择 138

5.6.4 Model──研发模型及发现知识 138

5.6.5 Assess──模型和知识的综合解释和评价 139

5.7 构造和使用数据挖掘模型 139

5.7.1 创建数据挖掘模型 139

5.7.3 培训数据挖掘模型 141

5.7.2 编辑数据挖掘模型 141

5.7.4 查看数据挖掘模型 142

5.7.5 高级数据挖掘模型操作 143

5.8 小结 143

第6章 MDX 147

6.1 概述 148

6.1.1 维度、级别、成员和度量值 148

6.2 基本概念 148

6.2.1 单元、元组和集合 149

6.2.2 轴维度和切片器维度 150

6.2.3 计算成员 150

6.2.4 用户定义函数 150

6.2.5 PivotTable服务 150

6.3 比较SQL和MDX 150

6.4 基本MDX 151

6.4.1 基本MDX查询 152

6.4.2 成员、元组和集合 153

6.4.3 轴维度和切片器维度 156

6.4.4 建立多维数据集上下文 158

6.5 高级MDX 158

6.5.1 创建和使用属性值 158

6.5.2 生成MDX中的命名集 163

6.5.3 生成MDX中的计算成员 166

6.5.4 生成MDX中的高速缓存 168

6.5.5 生成MDX中的计算单元 169

6.5.6 在MDX中创建和使用用户定义函数 170

6.5.7 使用回写 172

6.5.8 使用DRILLTHROUGH 检索源数据 174

6.5.9 理解传递次序和求解次序 174

6.6 小结 179

第7章 数据仓库工具和关键技术 181

7.1 OLAP查询分析工具 182

7.1.1 OLAP特征 182

7.1.2 选择OLAP工具 183

7.2 DSS的分析预测工具 185

7.2.1 DSS和IDSS 186

7.2.2 数据仓库和OLAP的决策支持技术 188

7.2.3 综合DSS 191

7.3 数据挖掘系统设计 192

7.3.1 数据挖掘的过程 193

7.3.2 数据挖掘系统的原型框架 196

7.3.3 数据挖掘面临的问题 198

7.3.4 数据挖掘工具的选择标准 199

7.4.1 数据仓库的组成部分 201

7.4 数据仓库体系结构的关键问题 201

7.4.2 数据仓库体系结构中的关键问题 202

7.5 小结 206

第8章 数据仓库实现和解决方案 207

8.1 数据仓库的数据库设计原则 208

8.1.1 简明数据模式的设计 209

8.1.2 保证数据的一致性 211

8.1.3 提高查询处理速度 213

8.2.1 详细设计数据仓库 214

8.1.4 提高数据装载效率 214

8.2 数据仓库总体设计 214

8.2.2 使用数据仓库 221

8.2.3 维护数据仓库 222

8.2.4 实现数据仓库 224

8.3 数据仓库的优化 226

8.3.1 概述 227

8.3.2 优化设计 228

8.3.3 面向超大型数据库和数据仓库的优化 228

8.3.4 实施数据仓库工程注意事项 232

8.4.1 数据仓库技术的应用 233

8.4 数据仓库技术的应用和解决方案 233

8.4.2 数据仓库解决方案 239

8.5 小结 246

第9章 SQL Server 数据仓库解决方案 247

9.1 Microsoft数据仓库解决方案概述 248

9.1.1 Microsoft数据仓库框架 249

9.1.2 Analysis Services 250

9.2.1 配置数据仓库环境 258

9.2 Microsoft数据仓库设计 258

9.2.2 创建多维数据集前准备 259

9.2.3 生成多维数据集 266

9.2.4 处理多维数据集 268

9.3 管理Microsoft数据仓库 272

9.3.1 创建安全角色 272

9.3.2 管理分区 276

9.3.3 增强和改善维度 280

9.3.4 增强和改善多维数据集 282

9.3.5 更新多维数据集和维度 285

9.4 Microsoft数据仓库数据服务 287

9.4.1 备份和还原数据库 287

9.4.2 复制对象 289

9.4.3 导入、导出和转换数据 290

9.5 小结 294

第10章 SQL Server数据仓库挖掘技术 297

10.1 创建和使用数据挖掘模型 298

10.1.1 Microsoft数据挖掘模型简介 298

10.1.2 创建数据挖掘模型 300

10.1.3 编辑数据挖掘模型 302

10.1.4 培训数据挖掘模型 302

10.1.5 查看数据挖掘模型 303

10.1.6 高级数据挖掘模型操作 304

10.2 OLAP数据挖掘模型实例 305

10.2.1 创建揭示客户模式的数据挖掘模型 305

10.2.2 读取客户决策树 307

10.2.3 浏览数据挖掘虚拟维度 310

10.3.1 创建揭示客户模式的数据挖掘模型 314

10.3 创建关系数据挖掘模型 314

10.3.2 读取客户决策树 317

10.3.3 浏览相关性网络 320

10.4 数据仓库高级技术 324

10.4.1 Internet连接 325

10.4.2 多维数据集的调度技术 328

10.5 小结 333

第11章 SAS数据仓库解决方案 335

11.1 SAS数据仓库概述 336

11.1.1 SAS数据仓库 337

11.1.2 SAS数据仓库的组成 337

11.1.3 SAS数据仓库的体系结构 339

11.1.4 开发SAS数据仓库 341

11.1.5 SAS的数据仓库产品——SAS/WA 343

11.1.6 SAS数据仓库方法论 345

11.2 SAS数据挖掘技术 347

11.2.1 挖掘策略 347

11.2.2 挖掘的方法论——SEMMA 348

11.2.3 数据挖掘应用实例 350

11.3 SAS工具 351

11.3.1 SAS核心系统 352

11.3.2 深层数据分析 353

11.3.3 客户端应用软件 360

11.3.4 桌面分析软件 362

11.4 SAS数据仓库设计 365

11.4.1 SAS/Warehouse Administrator概述 366

11.4.2 设置数据仓库环境 369

11.4.3 SAS数据操作 373

11.4.4 创建数据仓库 383

11.5 小结 395

第12章 数据仓库和CRM解决方案 397

12.1 CRM解决方案概述 398

12.1.1 CRM系统的组成 400

12.1.2 CRM的发展和目标 404

12.1.3 CRM的核心技术 405

12.1.4 CRM在我国电信企业的应用 406

12.1.5 电信运营商成功实施CRM的案例 407

12.1.6 CRM软件的选型 410

12.2 CRM实施与评价 411

12.2.1 准备工作 411

12.2.2 实施步骤 412

12.2.3 客户关系管理的评价 415

12.3 电信企业的CRM系统解决方案 416

12.3.1 电信企业的营销管理 416

12.3.2 电信企业的销售管理 418

12.3.3 电信企业的服务管理 419

12.4 数据仓库具体实现 420

12.4.1 实施数据仓库并实现数据分析 420

12.4.2 实施数据仓库详细策略 421

12.4.3 利用呼叫中心收集数据 423

12.4.4 电信企业的呼叫中心 424

12.4.5 广东移动实施数据仓库案例分析 427

12.5 小结 429

参考文献 430