《数据仓库工具箱 面向SQL Server2005和Microsoft商业智能工具集》PDF下载

  • 购买积分:17 如何计算积分?
  • 作  者:(美)曼蒂,桑斯维特,金伯尔著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2007
  • ISBN:7302163790
  • 页数:566 页
图书介绍:本书介绍数据仓库工具箱的应用,包括面向SQL Server 2005和Microsoft商业智能工具集。

第Ⅰ部分 需求、实施和体系结构第1章 定义业务需求 3

1.1 长期成功的最重要的决定因素 4

1.2 揭示业务价值 4

1.2.1 获得赞助商关系 5

1.2.2 定义企业级业务需求 5

1.2.3 区分优先级过程 13

1.2.4 项目规划 15

1.2.5 收集项目需求 15

1.3 业务需求示例:Adventure Works Cycles 16

1.3.1 Adventure Works Cycles公司的采访准备 17

1.3.2 Adventure Works Cycles企业业务需求 19

1.3.3 分析主题和业务过程 23

1.3.4 Adventure Works Cycles总线矩阵 25

1.3.5 Adventure Works Cycles区分优先级过程 26

1.3.6 订单项目的业务需求 27

1.4 小结 27

第2章 业务过程维度模型设计 29

2.1 维度建模概念和术语 30

2.1.1 事实表 31

2.1.2 维度 32

2.1.3 整合事实和维度 33

2.1.4 总线矩阵、一致性维度和交叉探查 34

2.2 其他设计概念和技术 37

2.2.1 代理键 37

2.2.2 渐变维度 38

2.2.3 日期 42

2.2.4 退化维度 43

2.2.5 雪花模型 43

2.2.6 多对多维度或者多值维度 44

2.2.7 层次结构 46

2.2.8 异构产品 47

2.2.9 聚合维度 48

2.2.10 无意义维度 50

2.2.11 三种事实表类型 51

2.2.12 聚合 52

2.3 维度建模过程 53

2.3.1 准备工作 55

2.3.2 数据记录和研究 59

2.3.3 构建维度模型 62

2.3.4 开发详细维度模型 66

2.3.5 模型测试 67

2.3.6 评审和确认模型 68

2.4 案例研究:创建Adventure Works Cycles订单维度模型 68

2.4.1 选择维度 68

2.4.2 确定订单业务过程的维度和事实属性 73

2.4.3 初始模型的最终草图 74

2.4.4 问题列表 75

2.4.5 详细维度模型开发 75

2.4.6 最终维度模型 77

2.5 小结 77

第3章 工具集 79

3.1 Microsoft DW/BI工具集 80

3.2 使用Microsoft工具集的原因 81

3.3 Microsoft DW/BI系统的体系结构 81

3.3.1 包含Analysis Services的原因 83

3.3.2 关于Analysis Services的争论 84

3.3.3 存储在关系数据库中的原因 85

3.4 Microsoft工具概述 85

3.4.1 需要的产品 86

3.4.2 SQL Server2005开发和管理工具 88

3.5 小结 92

第Ⅱ部分 开发和填充数据库 95

第4章 设置和物理设计 95

4.1 系统规模考虑事项 96

4.1.1 计算数据卷 96

4.1.2 确定应用复杂度 97

4.1.3 估计并发用户数 99

4.1.4 评估系统可用性需求 99

4.2 系统配置考虑 100

4.2.1 需要的内存 100

4.2.2 集成式还是分布式 100

4.2.3 使用的存储系统 102

4.2.4 处理器 103

4.2.5 高可用性配置 104

4.3 软件安装和配置 105

4.3.1 开发环境软件需求 106

4.3.2 测试和产品系统软件需求 109

4.3.3 操作系统 109

4.3.4 SQL Server关系数据库设置 110

4.3.5 Analysis Services设置 113

4.3.6 Integration Services设置 114

4.3.7 Reporting Services设置 115

4.4 物理数据仓库数据库设计 116

4.4.1 代理键 117

4.4.2 字符串列 117

4.4.3 空或非空 118

4.4.4 插入未知成员行 118

4.4.5 数据表和列的扩展属性 118

4.4.6 常规事务列 118

4.4.7 索引和列约束条件 119

4.4.8 创建数据表视图 121

4.4.9 事实表分区 122

4.4.10 聚合数据表 128

4.4.11 中间表 129

4.4.12 元数据设置 129

4.5 小结 129

第5章 设计ETL系统 131

5.1 SQL Server Integration Services简介 132

5.1.1 BI Studio Integration Services工具概述 133

5.1.2 控制流 134

5.1.3 数据流 136

5.1.4 动态程序包概念 141

5.1.5 事件处理程序 143

5.2 高级计划 144

5.2.1 开发第一个概要性高级映射 144

5.2.2 构建沙箱源系统 146

5.2.3 执行数据记录 147

5.2.4 完成源到目的的映射 147

5.2.5 加载频率 148

5.2.6 多少历史信息 148

5.2.7 使用分区 149

5.2.8 历史加载和增量加载 150

5.2.9 开发提取数据的策略 151

5.2.10 人员和机构的重复数据删除 155

5.2.11 开发维度分布的策略 156

5.3 更新Analysis Services数据库 157

5.4 ETL系统物理设计 158

5.4.1 系统体系结构和Integration Services 158

5.4.2 中间表区域 159

5.4.3 程序包存储 159

5.4.4 程序包命名约定 160

5.5 开发详细的规范 160

5.6 小结 162

第6章 开发ETL系统 163

6.1 起始 164

6.1.1 创建解决方案、项目和数据源 165

6.1.2 程序包模板 166

6.1.3 主程序包和子程序包 167

6.2 维度处理 169

6.2.1 维度处理的基本要求 169

6.2.2 提取修改后的记录 176

6.2.3 渐变维度 178

6.2.4 重复数据删除和模糊变换 186

6.3 事实处理 188

6.3.1 提取事实数据 188

6.3.2 提取事实的更新和删除 190

6.3.3 清除事实数据 191

6.3.4 检查数据质量及暂停程序的执行 192

6.3.5 转换事实数据 197

6.3.6 代理键管道 200

6.3.7 加载事实数据 203

6.3.8 Analysis Services的处理过程 208

6.4 补充介绍 208

6.4.1 审核系统 208

6.4.2 主程序包 211

6.4.3 程序包事件处理 214

6.4.4 单元测试 214

6.5 小结 215

第7章 设计Analysis Services OLAP数据库 217

7.1 选择Analysis Services的原因 218

7.1.1 聚合管理 218

7.1.2 聚合导航 219

7.1.3 针对每种度量的求和逻辑 219

7.1.4 查询性能 220

7.1.5 计算 220

7.1.6 使用Analysis Services的其他原因 220

7.1.7 不使用Analysis Services的原因 222

7.2 设计OLAP结构 223

7.2.1 起始 223

7.2.2 创建项目和数据源视图 226

7.2.3 维度设计 229

7.2.4 创建和编辑维度 232

7.2.5 创建和编辑多维数据集 242

7.3 物理设计的考虑因素 256

7.3.1 存储模式:MOLAP、HOLAP、ROLAP 257

7.3.2 设计聚合 258

7.3.3 分区计划 259

7.3.4 部署计划 261

7.3.5 历史处理计划 261

7.3.6 增量处理计划 262

7.4 小结 265

第Ⅲ部分 商业智能应用程序的开发第8章 商业智能应用程序 269

8.1 商业智能的基本概念 270

8.1.1 标准报表 271

8.1.2 分析应用程序 271

8.1.3 BI应用程序开发人员 272

8.2 商业智能应用程序的价值 274

8.3 交付平台选项 275

8.4 BI应用程序的开发过程 276

8.4.1 应用程序的说明 276

8.4.2 应用程序的开发 284

8.4.3 维护 288

8.5 小结 289

第9章 在Reporting Services中构建BI应用程序 291

9.1 报表高层次的体系结构 292

9.1.1 回顾报表的业务需求 293

9.1.2 Reporting Services的体系结构 295

9.1.3 使用Reporting Services作为一个标准的报表工具 297

9.1.4 Reporting Services的评价 303

9.2 报表的构建和传送 304

9.2.1 规划和准备 304

9.2.2 创建报表 306

9.2.3 BI门户 316

9.2.4 报表的运行 320

9.3 小结 322

第10章 数据挖掘的加入 325

10.1 数据挖掘的定义 326

10.1.1 基本的数据挖掘的术语 327

10.1.2 数据挖掘的业务应用 328

10.1.3 角色和责任 334

10.2 SQL Server数据挖掘体系结构的概述 334

10.2.1 数据挖掘设计环境 335

10.2.2 构建、部署和处理 336

10.2.3 挖掘模型的访问 336

10.2.4 Integration Services和数据挖掘 337

10.2.5 额外的功能 337

10.2.6 体系结构的总结 338

10.3 Microsoft数据挖掘的算法 338

10.3.1 决策树 339

10.3.2 贝叶斯算法 340

10.3.3 聚类 341

10.3.4 顺序分析和聚类分析 341

10.3.5 时间序列 341

10.3.6 关联 341

10.3.7 神经网络 342

10.4 数据挖掘的过程 342

10.4.1 业务阶段 343

10.4.2 数据挖掘阶段 344

10.4.3 运行阶段 350

10.4.4 元数据 351

10.5 数据挖掘的示例 352

10.5.1 示例学习:给城市分类 352

10.5.2 案例研究:产品推荐 360

10.6 小结 375

第Ⅳ部分 DW/BI系统的部署和管理第11章 使用现有的数据仓库进行工作 379

11.1 事情的现状 379

11.1.1 数据质量 380

11.1.2 集市混乱 381

11.1.3 业务认可的混乱 381

11.1.4 基础设施的混乱 382

11.1.5 行政和机构上的问题 382

11.1.6 完全健康 383

11.2 从SQL Server 2000转换到SQL Server 2005 383

11.2.1 关系数据仓库 383

11.2.2 Integration Services 384

11.2.3 Analysis Services 384

11.2.4 Reporting Services 385

11.2.5 数据挖掘 385

11.3 与非SQL Server 2005组件的集成 385

11.3.1 关系数据库的替换 386

11.3.2 Integration Services的替换 387

11.3.3 Analysis Services OLAP、数据挖掘或Reporting Services的替换 388

11.3.4 非Microsoft的即席查询工具的使用 388

11.4 小结 390

第12章 安全 391

12.1 确定安全管理员 392

12.2 保护硬件 393

12.3 保护操作系统 393

12.4 保护开发环境 394

12.5 保护数据 395

12.5.1 向内部用户提供开放的访问 395

12.5.2 分条列出敏感数据 396

12.5.3 保护各种类型的数据访问 396

12.5.4 您该做些什么 401

12.5.5 Windows集成安全认证 402

12.5.6 Analysis Services的安全 403

12.5.7 关系DW的安全 412

12.5.8 Reporting Services安全 419

12.5.9 Integration Services安全 421

12.6 使用情况的监控 422

12.7 保护隐私 422

12.8 小结 423

第13章 元数据规划 425

13.1 元数据的基础 426

13.1.1 元数据的目标 426

13.1.2 元数据的存储空间 427

13.2 元数据标准 428

13.3 SQL Server 2005元数据 430

13.3.1 Cross-Tool组件 434

13.3.2 关系引擎的元数据 434

13.3.3 Analysis Services 435

13.3.4 Integration Services 436

13.3.5 Reporting Services 436

13.3.6 外部元数据的源 437

13.3.7 对SQL Server元数据的期待 438

13.4 实用的元数据方法 438

13.4.1 元数据策略的创建 439

13.4.2 业务元数据报表 440

13.4.3 过程元数据报表 448

13.4.4 技术元数据报表 449

13.4.5 过程元数据的管理 449

13.4 小结 449

第14章 部署 451

14.1 系统部署 452

14.1.1 部署前的测试 452

14.1.2 部署 465

14.2 数据仓库和BI文档 472

14.2.1 核心的说明 472

14.2.2 额外的文档 473

14.2.3 额外的功能 474

14.3 用户的培训 474

14.3.1 培训的开发 475

14.3.2 培训的传递 477

14.4 用户支持 478

14.5 台式计算机的准备和配置 479

14.6 小结 480

第15章 运行与维护 483

15.1 提供用户支持 484

15.1.1 BI门户的维护 485

15.1.2 BI应用程序的扩充 485

15.2 系统管理 486

15.2.1 ETL程序包的执行 486

15.2.2 商业智能系统的监控 489

15.2.3 磁盘空间的管理 498

15.2.4 查询的取消 500

15.2.5 服务和可用性的管理 501

15.2.6 DW/BI系统的性能调整 502

15.2.7 Analysis Services的性能调整 502

15.2.8 分区的管理 505

15.2.9 备份和恢复 510

15.3 小结 515

第Ⅴ部分 DW/BI系统的扩充 519

第16章 成长的管理 519

16.1 生命周期的迭代:成长的DW/BI系统 520

16.1.1 业务需求和项目管理 520

16.1.2 技术跟踪 520

16.1.3 数据的跟踪 521

16.1.4 应用程序的跟踪 521

16.1.5 部署、维护和成长 521

16.2 销售和期望的管理 522

16.2.1 利害关系人 522

16.2.2 定量的技术 523

16.2.3 定性的技术 524

16.3 系统互连 528

16.3.1 下游系统 528

16.3.2 主数据 528

16.3.3 BI Web服务 529

16.4 小结 530

第17章 实时商业智能 531

17.1 为(和不为)实时数据创建事例 532

17.1.1 让实时数据的传送变得困难的原因 532

17.1.2 什么让实时数据变得具有价值 533

17.1.3 您该做些什么 534

17.2 实时地执行报表 536

17.2.1 通过缓存向报表提供服务 536

17.2.2 从Integration Services程序包中获取报表 537

17.3 实时地加载DW/BI系统 539

17.3.1 集成的方法 539

17.3.2 实时层 540

17.4 使用Analysis Services来传送实时数据 543

17.4.1 从标准化的数据中构建多维数据集 543

17.4.2 主动缓存 544

17.4.3 通过Analysis Services实时地使用Integration Services 554

17.5 小结 555

第18章 目前的需要以及未来的展望 557

18.1 DW/BI项目中的很大风险 557

18.1.1 阶段Ⅰ——需求、现实、规划和设计 558

18.1.2 阶段Ⅱ——数据库和应用程序的开发 558

18.1.3 阶段Ⅲ——DW/BI系统的部署和管理 559

18.1.4 阶段Ⅳ——DW/BI系统的扩充 559

18.2 Microsoft BI工具集中受欢迎的部分 560

18.3 未来的方向:改进的空间 560

18.3.1 查询工具 561

18.3.2 元数据 561

18.3.3 关系数据库引擎 561

18.3.4 Analysis Services 562

18.3.5 分析应用程序 562

18.3.6 集成 562

18.4 小结 563