《数据仓库生命周期工具箱 设计、开发和部署数据仓库的专家方法》PDF下载

  • 购买积分:20 如何计算积分?
  • 作  者:(美)Ralph Kimball等著;肖明,王永红等译
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2004
  • ISBN:7505391925
  • 页数:708 页
图书介绍:本书主要介绍了使数据仓库项目获得成功所必备的各种知识及经验,它们都是作者从事数以百计的数据仓库安装和咨询任务过程中不断积累总结出来的。书末的两个附录中提供了大量的框架、任务、模板以及生动详实的样例(具体内容见本书配套光盘),所有这些都使本书别具一格。全书主题广泛,思想深刻,内容详尽,图文并茂。本书不仅是现代信息系统开发人员的重要指南,而且是所有面向数据仓库项目的设计、开发、管理、咨询人员的高级参谋。

第1章 数据仓库的基本组成 1

1.1 数据仓库的基本组成要素 1

1.2 数据仓库基本过程 10

1.3 有关数据仓库的大讨论 13

1.3.1 数据仓库建模 14

1.3.2 数据集市与数据仓库 14

1.3.3 分布式与集中式数据仓库 15

小结 16

第一部分 项目管理与需求 19

第2章 业务维生命周期 19

2.1 生命周期演化 19

2.2 生命周期方法 20

2.2.1 项目规划 21

2.2.2 业务需求定义 21

2.2.3 数据轨迹:维度建模 22

2.2.4 数据轨迹:物理设计 22

2.2.5 数据轨迹:数据登台设计与开发 22

2.2.6 技术轨迹:技术结构设计 23

2.2.7 技术轨迹:产品选择与安装 23

2.2.8 应用轨迹:最终用户应用规范 23

2.2.9 应用轨迹:最终用户应用开发 24

2.2.10 部署 24

2.2.11 维护与增长 24

2.2.12 项目管理 25

2.3 业务维生命周期使用指南 25

2.4 业务维生命周期指示标记与浏览帮助 26

小结 27

第3章 项目规划与管理 28

3.1 项目定义 29

3.1.1 建设数据仓库应做的准备工作 30

3.1.2 “最后检验”准备是否就绪 32

3.1.3 评价影响准备就绪的因素 34

3.1.4 分析准备状态是否不足的方法 35

3.1.5 确定初步范围 39

3.1.6 构造业务的合理性证明 43

3.2 项目规划 48

3.2.1 建立项目标识 48

3.2.2 组建项目组 49

3.2.3 制定项目计划 57

3.3 项目管理 61

3.3.1 举行项目小组启动会议 62

3.3.2 监控项目状态 63

3.3.3 维护项目计划和项目文档 66

3.3.4 管理项目范围 67

3.3.5 制定有关管理期望的交流计划 70

小结 74

第4章 收集项目需求 78

4.1 定义项目需求的各种方法 79

4.2 访谈准备 81

4.3 准备合适的访谈者 91

4.4 进行访谈 94

4.5 开始访谈 96

4.6 结束访谈 104

4.7 对访谈结果进行审查 107

4.8 准备和发布项目需求规范文档 109

4.9 项目需求收集完成后的工作 112

小结 114

第二部分 数据设计 121

第5章 维度建模的第1课 121

5.1 维度建模案例 122

5.1.1 什么是实体-关系建模 122

5.1.2 什么是维度建模 125

5.1.3 维度建模与实体-关系建模之间的关系 127

5.1.4 维度建模的优点 128

5.2 利用数据仓库总线结构将各种维度模型组合起来 133

5.2.1 规划危机 134

5.2.2 带总线结构的数据集市 135

5.2.3 一致性维度和标准事实的定义 136

5.2.4 一致性维度的设计 138

5.2.5 确保采用一致性维度 138

5.2.6 建立一致性事实定义 139

5.2.7 数据集市粒度的重要性 140

5.2.8 多元数据集市 141

5.2.9 拯救不兼容性数据集市 142

5.2.10 何时不需要一致性维度 142

5.2.11 数据仓库总线 143

5.3 基本维度建模技术 144

5.3.1 事实表与维度表 144

5.3.2 向上和向下探查维度表内情 146

5.3.3 建议使用的时间维度 153

5.3.4 加法性事实、半加法性事实以及非加法性事实 169

5.3.5 设计单个事实表的4步设计方法 170

小结 190

第6章 维度建模的研究生课程 191

6.1 扩充维度表的设计 192

6.1.1 多对多维度 192

6.1.2 多对一与一对多陷阱 195

6.1.3 维度的不同角色扮演 196

6.1.4 组织与其下级部门的层次表示 199

6.1.5 不可预知的层次深度 203

6.1.6 大型维度中的时间戳变化 205

6.1.7 创建审计维度 209

6.1.8 维度数是太少了还是太多了 209

6.2 扩充事实表的设计 211

6.2.1 具有不同粒度的事实及其分配 211

6.2.2 以天为单位的维度表 215

6.2.3 多种指标单位 217

6.2.4 跨国货币情况跟踪 219

6.2.5 数值分组报告 221

6.3 高级ROLAP查询和报告 222

6.3.1 采用多种技术探查的查询 222

6.3.3 市场份额分析 229

小结 231

第7章 多维模型的创建 233

7.1 开始阶段使用的矩阵方法 234

7.1.1 矩阵的创建 234

7.1.2 必要的准备 235

7.1.3 列出数据集市 236

7.1.4 列出各种维度 237

7.1.5 标记交叉点 238

7.2 用4步法设计各个事实表 240

7.3 管理维度建模项目 243

7.3.1 数据仓库总线结构矩阵 244

7.3.2 事实表图表 244

7.3.3 事实表明细图 246

7.3.4 维度表明细图 247

7.3.5 维度建模小组的创建步骤 250

7.3.6 创建初始草图 251

7.3.7 跟踪基本事实和派生事实 252

7.3.8 让信息系统小组进行输入 257

7.3.9 与核心业务用户一起工作 257

7.3.10 向业务用户进行介绍 258

7.4 管理建模过程中存在的问题 259

7.4.1 为每个事实表和维度表确定来源 260

7.4.2 候选数据源 261

7.4.3 源数据所有权 263

7.4.4 数据提供者 263

7.4.5 选择数据源的详细准则 263

7.4.6 客户匹配与内部成员匹配 266

7.4.7 浏览数据内容 266

7.4.8 将源数据映射到目标数据 268

7.4.9 什么时候才算完成 270

7.4.10 为未来做准备 271

7.4.11 使用数据建模工具 272

7.4.12 估计行数 272

7.4.13 聚集设计 273

7.4.14 确定聚集的内容 274

小结 275

第三部分 数据仓库结构 281

第8章 数据仓库结构介绍 281

8.1 结构的价值 282

8.2 一个结构框架和方法 284

8.2.1 定义列 285

8.2.2 定义细节级别(行) 287

8.2.3 逻辑模型与物理模型 289

8.2.4 框架小结 289

8.3 技术结构概述 290

8.3.1 服务和数据存储 291

8.3.2 从源系统到用户桌面的流程 291

8.3.3 主要技术结构特性 293

8.3.4 数据仓库结构评估 295

小结 296

第9章 后台技术结构 297

9.1 后台数据存储 298

9.1.1 源系统 298

9.1.2 数据登台区 305

9.1.3 呈现服务器 306

9.2 后台服务 310

9.2.1 普通数据登台要求 311

9.2.2 创建与购买 316

9.2.3 提取服务 317

9.2.4 数据转换服务 320

9.2.5 数据装载服务 323

9.2.6 数据登台作业控制服务 323

9.3 后台资产管理 326

9.3.1 备份与恢复 326

9.3.2 存档与检索 327

9.3.3 备份与存档规划 328

9.3.4 提取和装载安全性问题 329

9.3.5 未来登台服务 329

小结 331

第10章 前台结构 332

10.1 前台数据存储 334

10.1.1 存取工具数据存储 334

10.1.2 标准报告数据存储 334

10.1.3 下行系统 336

10.2 用于数据存取的前台服务 337

10.2.1 数据仓库浏览 337

10.2.2 存取与安全性服务 338

10.2.3 活动监控服务 339

10.2.4 查询管理服务 340

10.2.5 查询服务位置 343

10.2.6 标准报告服务 344

10.2.7 未来存取服务 345

10.2.8 桌面服务 346

10.2.9 建模应用和数据挖掘 356

10.2.10 数据存取的Web含义 359

10.2.11 桌面工具结构方法 360

小结 363

第11章 体系结构与元数据 365

11.1 体系结构 366

11.1.1 体系结构的驱动力 366

11.1.2 体系结构的演变 367

11.1.3 后台体系结构因素 368

11.1.4 前台体系结构因素 381

11.1.5 连通性与联网因素 383

11.1.6 体系结构小结 386

11.2 元数据与元数据目录 386

11.2.1 什么是元数据 387

11.2.2 源系统元数据 388

11.2.3 数据登台元数据 389

11.2.4 数据库管理系统元数据 390

11.2.5 前台元数据 391

11.2.6 活动元数据样例 392

11.2.7 元数据目录的维护 396

11.2.8 元数据小结 398

小结 399

第12章 有关互联网和安全性方面的研究生课程 400

12.1 组件软件结构 402

12.1.1 互联网对结构的影响 405

12.2 安全性的脆弱 407

12.2.1 物理资产 409

12.2.2 信息资产:数据、财务资产以及声誉 411

12.2.3 软件资产 417

12.2.4 执行业务任务的能力 418

12.2.5 网络威胁 419

12.3 安全性:解决方案 422

12.3.1 路由器与防火墙 423

12.3.2 目录服务器 428

12.3.3 加密技术 429

12.4 数据仓库环境下的安全性管理 441

12.5 在安全性方面应采取的措施 442

12.5.1 立即执行的战术性措施 442

12.5.2 战略性措施 444

小结 444

第13章 创建结构计划与产品选择 447

13.1 创建结构 448

13.1.1 结构创建过程 449

13.1.2 创建技术结构计划 450

13.2 选择产品 460

13.2.1 集中关注业务需求 460

13.2.2 主要数据仓库评估区域 460

13.2.3 评估过程 461

13.2.4 创建产品评估矩阵 462

13.2.5 进行市场研究 465

13.2.6 将选择缩减到一份简短清单上 465

13.2.7 评估选项 466

13.2.8 选择开发一个原型 467

13.2.9 产品推荐 473

13.2.10 评估捷径 473

13.2.11 后台评估 475

13.2.12 前台评估 477

13.3 安装 480

小结 480

第四部分 数据仓库实施 489

第14章 有关聚集的研究生课程 489

14.1 聚集的目标和风险 490

14.2 确定要聚集的内容 491

14.3 制定聚集表计划 492

14.4 对聚集进行处理 495

14.5 对聚集进行管理 497

14.6 聚集浏览系统的设计目标 501

14.7 聚集浏览算法 505

14.7.1 与规划数据相交 509

14.7.2 有关MIN,MAX,COUNT,AVG的处理 509

14.7.3 适用于所有人的聚集 510

小结 511

第15章 完成物理设计 512

15.1 制定标准 514

15.1.1 数据库对象命名标准 514

15.1.2 为用户存取的所有表使用同义词 517

15.1.3 物理文件位置 517

15.2 创建物理数据模型 518

15.2.1 饮料商店销售额案例研究 520

15.2.2 数据建模工具的使用 520

15.2.3 物理数据结构的设计 522

15.2.4 估计最初的开发规模 529

15.3 制定最初的索引计划 533

15.3.1 索引和查询策略概述 533

15.3.2 为事实表创建索引 537

15.3.3 为维度表创建索引 538

15.3.4 为装载创建索引 538

15.3.5 在装载完成后对表和索引进行分析 539

15.3.6 索引案例研究 539

15.4 设计和创建数据库实例 542

15.4.1 内存 542

15.4.2 块大小 542

15.4.3 磁盘存取样例 543

15.4.4 保存数据库创建脚本和参数文件 544

15.5 创建物理存储结构 545

15.5.1 计算表和索引的大小 545

15.5.2 制定分割计划 546

15.5.3 建立RAID 547

15.6 实施使用监控系统 549

15.6.1 性能 549

15.6.2 用户支持 550

15.6.3 市场营销 550

15.6.4 规划 551

15.6.5 工具 551

小结 552

第16章 数据登台 556

16.1 数据登台概述 557

16.2 做一些预备工作 558

16.2.1 良好系统开发实践的重要性 558

16.3 进行有效的计划 558

16.3.1 步骤1:高级计划 559

16.3.2 步骤2:数据登台工具 560

16.3.3 步骤3:详细计划 561

16.4 维度表登台 563

16.4.1 步骤4:装载一个简单的维度表 564

16.4.2 静态维度表的转换 565

16.4.3 步骤5:实施维度变化逻辑 570

16.4.4 步骤6:装载剩余维度表 573

16.5 事实表装载与数据仓库操作 576

16.5.1 步骤7:装载原子级历史事实 576

16.5.2 步骤8:增量式事实表登台 585

16.5.3 步骤9:聚集表和多维联机分析处理装载 591

16.5.4 步骤10:数据仓库的操作与自动化 594

16.6 数据质量与净化 597

16.6.1 数据质量改进 598

16.6.2 数据质量保证 602

16.7 其他问题 603

16.7.1 数据登台区中的存档问题 604

16.7.2 源系统中的回退段问题 604

16.7.3 磁盘空间管理问题 604

小结 605

第17章 创建最终用户应用 609

17.1 最终用户应用角色 610

17.1.1 最终用户应用模板 611

17.1.2 生命周期的时间选择 613

17.2 应用规范 614

17.2.1 确定最初的模板集合 614

17.2.2 设计模板浏览方法 618

17.2.3 确定模板标准 619

17.2.4 详细模板规范 620

17.2.5 用户审查 621

17.3 最终用户应用开发 622

17.3.1 选择一种实现方法 622

17.3.2 应用开发 623

17.3.3 测试与数据验证 625

17.3.4 文档及其展示 626

17.3.5 像软件开发管理人员那样思考问题 627

17.3.6 应用模板维护 628

小结 628

第五部分 数据仓库的部署与增长 635

第18章 规划部署 635

18.1 确定是否已经准备好桌面安装 636

18.2 制定最终用户培训策略 637

18.2.1 集成和裁剪培训内容 637

18.2.2 开展最终用户培训 640

18.2.3 实施最终用户培训 641

18.3 制定最终用户支持策略 643

18.3.1 确定对组织结构的支持 644

18.3.2 参与数据协调方面的支持 645

18.3.3 参与最终用户应用支持 646

18.3.4.建立交流与反馈支持 646

18.3.5 提供支持文档 647

18.4 研制部署发布框架 649

18.4.1 Alpha版本发布 649

18.4.2 Beta版本发布 650

18.4.3 产品发布(又名部署) 651

18.5 编制有关部署策略的文档 654

小结 654

第19章 数据仓库的维护与增长 657

19.1 对现有数据仓库环境的管理 658

19.1.1 关注业务用户 659

19.1.2 管理数据仓库操作 662

19.1.3 数据仓库的成功测度和市场营销 664

19.1.4 经常进行交流 666

19.2 为数据仓库的增长与演变做准备 667

19.2.1 建立数据仓库指导委员会 668

19.2.2 优化数据仓库增长与演变的机会 670

19.2.3 采用生命周期方法来管理数据仓库的迭代增长与演变 671

小结 673

附录A 生命周期项目计划 677

附录B 关于本书附带的CD-ROM 693

B.1 项目计划 693

B.2 数据仓库总线结构样例 693

B.3 模板、检查清单、图形和帮助 694

第2章 业务维生命周期 695

第3章 项目规划与管理 695

第4章 项目需求的收集 696

第7章 多维模型的创建 696

第8章 数据仓库结构介绍 696

第9章 后台技术结构 697

第10章 前台结构 697

第11章 体系结构与元数据 697

第12章 有关互联网和安全性的研究生课程 697

第13章 结构计划的创建与产品的选择 697

第15章 完成物理设计 698

第16章 数据登台 698

第17章 创建最终用户应用 698

第18章 规划部署 699

B.4 CD-ROM的使用 699

B.5 CD-ROM浏览器的用法说明 699

B.6 软件要求 699