当前位置:首页 > 工业技术
Microsoft数据仓库工具箱  使用SQL Server 2008 R2和Microsoft BI工具集
Microsoft数据仓库工具箱  使用SQL Server 2008 R2和Microsoft BI工具集

Microsoft数据仓库工具箱 使用SQL Server 2008 R2和Microsoft BI工具集PDF电子书下载

工业技术

  • 电子书积分:15 积分如何计算积分?
  • 作 者:(美)蒙迪,(美)桑思韦特,(美)金博尔著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2012
  • ISBN:9787302283362
  • 页数:460 页
图书介绍:本书内容包括DW/BI系统的需求、实施和体系结构,开发和填充数据库,商务智能应用程序的开发,DW/BI系统的部署和管理,DW/BI系统的扩充等。新版本涵盖了SQL Server 2008 R2中新DW/BI工具的用法,并以案例形式展示了DW/BI系统从设计、开发、配置到维护的整个生命周期。
《Microsoft数据仓库工具箱 使用SQL Server 2008 R2和Microsoft BI工具集》目录

第Ⅰ部分 需求、现实情况和体系结构 3

第1章 定义业务需求 3

1.1长期成功的最重要的决定因素 4

1.2 Adventure Works Cycles简介 5

1.3揭示业务价值 5

1.3.1获得赞助商关系 6

1.3.2定义企业级业务需求 6

1.4设定业务需求的优先级 17

1.5项目规划 19

1.6收集项目需求 20

1.7小结 21

第2章 业务过程维度模型设计 23

2.1维度建模概念和术语 24

2.1.1事实表 25

2.1.2维度 26

2.1.3整合事实和维度 27

2.1.4总线矩阵、一致性维度和交叉探查 28

2.2其他设计概念和技术 30

2.2.1代理键 30

2.2.2渐变维度 31

2.2.3日期 32

2.2.4退化维度 33

2.2.5雪花模型 33

2.2.6多对多维度或多值维度 34

2.2.7层次结构 36

2.2.8聚合维度 38

2.2.9无意义维度 39

2.2.10 3种事实表类型 40

2.2.11聚合 41

2.3维度建模过程 41

2.3.1准备工作 42

2.3.2数据剖析和研究 45

2.3.3构建维度模型 47

2.3.4开发详细维度模型 50

2.3.5模型测试和细化 51

2.3.6评审和验证模型 51

2.4案例研究:Adventure Works Cycles订单维度模型 51

2.4.1订单事实表 51

2.4.2维度 52

2.4.3确定订单业务过程的维度属性和事实 54

2.4.4初始订单模型的最终草图 55

2.4.5详细订单维度模型开发 56

2.4.6最终的维度模型 57

2.5小结 57

第3章 工具集 59

3.1 Microso DW/BI工具集 60

3.2使用Microso工具集的原因 61

3.3 Microso DW/BI系统的体系结构 61

3.3.1包含nalysis Services的原因 63

3.3.2存储在关系数据库中的原因 64

3.3.3 ETL不是可选的 64

3.3.4 Master Data Services的作用 65

3.3.5交付BI应用程序 65

3.4 Microso工具概述 66

3.4.1需要的产品 66

3.4.2 SQL Server开发和管理工具 68

3.5小结 71

第4章 系统设置 73

4.1系统规模的考虑事项 74

4.1.1计算数据卷 74

4.1.2确定应用复杂度 75

4.1.3估计并发用户数 76

4.1.4评估系统可用性需求 77

4.1.5系统的规模 77

4.2系统配置考虑事项 77

4.2.1内存 77

4.2.2一体化还是分布式 78

4.2.3存储系统考虑事项 80

4.2.4处理器 83

4.2.5高可用性设置 83

4.3软件安装和配置 84

4.3.1开发环境的软件需求 85

4.3.2 测试和产品系统的软件需求 88

4.3.3操作系统 89

4.3.4 SQL Server关系数据库设置 89

4.3.5 Analysis Services设置 92

4.3.6 Integration Services设置 94

4.3.7 Repoing Services设置 95

4.4小结 96

第Ⅱ部分 建立和填充数据库 99

第5章 创建关系数据仓库 99

5.1开始 100

5.2完成物理设计 101

5.2.1代理键 101

5.2.2字符串列 101

5.2.3空或非空 102

5.2.4常规事务列 103

5.2.5数据表和列的扩展属性 104

5.3定义存储器并创建约束和支持对象 104

5.3.1创建文件和文件组 104

5.3.2数据压缩 105

5.3.3实体和引用完整性约束 106

5.3.4初始索引和数据库统计 107

5.3.5聚合表 109

5.3.6创建数据表视图 110

5.3.7插入未知成员行 111

5.3.8 CREATE TABLE语句示例 111

5.4分区表 112

5.4.1分区表的工作方式 112

5.4.2管理分区表 115

5.5收尾 119

5.5.1中间表 119

5.5.2元数据设置 119

5.6小结 120

第6章 主数据的管理 121

6.1管理主引用数据 122

6.1.1属性不完整 122

6.1.2数据集成 123

6.1.3系统集成 124

6.1.4主数据管理系统和数据仓库 125

6.2 SQL Server主数据服务 125

6.2.1模型定义功能 125

6.2.2数据管理功能 127

6.3创建简单的应用程序 131

6.3.1业务场景 131

6.3.2尽可能简单 131

6.3.3创建MDS模型 132

6.3.4加载子类别成员 134

6.3.5改进模型 135

6.3.6导出到数据仓库 136

6.4小结 136

第7章 设计和开发ETL系统 137

7.1确定需求 138

7.2制定ETL计划 139

7.3 SQL Server Integration Services概述 141

7.3.1控制流和数据流 142

7.3.2 SSIS程序包的体系结构 145

7.4 ETL的主要子系统 145

7.5提取数据 146

7.5.1子系统1:数据剖析 146

7.5.2子系统2:更改数据捕获系统 146

7.5.3子系统3:提取系统 148

7.6清理和一致化数据 151

7.6.1子系统4:数据清理系统 152

7.6.2子系统5:错误事件模式 158

7.6.3子系统6:审核维度汇编器 158

7.6.4子系统7:重复数据删除系统 159

7.6.5子系统8:一致化系统 160

7.7传递数据以用于展示 160

7.7.1子系统9:渐变维度管理器 161

7.7.2子系统10:代理键生成器 164

7.7.3子系统11:层次结构管理器 164

7.7.4子系统12:特殊维度管理器 165

7.7.5子系统13:事实表构建器 166

7.7.6子系统14:代理键管道 169

7.7.7子系统15:多值维度桥接表构建器 173

7.7.8子系统16:迟到数据的处理程序 173

7.7.9子系统17:维度管理器 175

7.7.10子系统18:事实提供程序系统 175

7.7.11子系统19:聚合构建器 175

7.7.12子系统20:OLAP多维数据集构建器 176

7.7.13子系统21:数据传播管理器 176

7.8管理ETL环境 176

7.9小结 178

第8章 核心Analysis Services OLAP数据库 181

8.1 Analysis Services OLAP概述 182

8.1.1使用Analysis Services的原因 183

8.1.2不使用Analysis Services的原因 184

8.2设计OLAP结构 185

8.2.1规划 185

8.2.2起始工作 187

8.2.3创建项目和数据源视图 188

8.2.4维度设计 190

8.2.5创建和编辑维度 193

8.2.6创建和编辑多维数据集 202

8.3物理设计的考虑因素 215

8.3.1理解存储模式 216

8.3.2分区计划 217

8.3.3设计性能聚合 219

8.3.4部署计划 220

8.3.5处理整个多维数据集 220

8.3.6开发增量处理计划 221

8.4小结 224

第9章 实时商业智能的设计需求 227

9.1实时分类 228

9.1.1实时的含义 228

9.1.2需要实时的人员 229

9.1.3对实时的权衡 229

9.2场景和解决方案 231

9.2.1实时地执行报表 232

9.2.2通过缓存向报表提供服务 232

9.2.3用镜像和快照创建ODS 233

9.2.4用复制功能创建ODS 233

9.2.5建立BizTalk应用程序 234

9.2.6建立实时关系分区 234

9.3小结 237

第Ⅲ部分 商业智能应用程序的开发 241

第10章在Repoing Seices中构建BI应用程序 241

10.1 BI应用程序概述 242

10.2商业智能应用程序的价值 243

10.3报表设计高层次的体系结构 244

10.3.1回顾报表设计的业务需求 245

10.3.2 Repoing Services的体系结构 246

10.3.3使用Repoing Services作为标准的报表设计工具 247

10.3.4 Repoing Services的评价 253

10.4报表设计系统的设计和开发过程 253

10.4.1报表设计系统的设计 254

10.4.2报表设计系统的开发 260

10.5报表的构建和传送 262

10.5.1规划和准备 262

10.5.2创建报表 264

10.5.3报表设计的运行 275

10.6即席报表设计选项 275

10.6.1报表模型 276

10.6.2共享数据集 277

10.6.3报表部件 277

10.7小结 277

第11章PowerPivot和Excel 279

11.1使用Excel进行分析和报表设计 280

11.2 PowerPivot体系结构 281

11.3创建和使用PowerPivot数据库 283

11.3.1开始使用PowerPivot 283

11.3.2 PowerPivot表的设计 284

11.3.3使用PowerPivot创建分析表 286

11.3.4 PowerPivot for Excel的观察和指导原则 291

11.4 PowerPivot for SharePoint 291

11.4.1 PowerPivot SharePoint用户体验 292

11.4.2服务器级别的资源 294

11.4.3 PowerPivot的监控和管理 295

11.5 PowerPivot在托管DW/BI环境下的作用 297

11.6小结 297

第12章BI门户和SharePoint 299

12.1 BI门户 300

12.1.1 BI门户的规划 300

12.1.2对设计的影响 301

12.1.3业务过程的类别 302

12.1.4额外的功能 302

12.1.5建立BI门户 303

12.2把ShaPoint用作BI门户 304

12.2.1体系结构和概念 305

12.2.2安装SharePoint 309

12.2.3安装测试系统 312

12.2.4完成BI门户 315

12.2.5 BIPortal站点模板的其他功能 315

12.2.6研究SharePoint 316

12.3小结 316

第13章 数据挖掘的加入 317

13.1数据挖掘的定义 318

13.1.1基本的数据挖掘术语 319

13.1.2数据挖掘的业务应用 320

13.1.3角色和责任 324

13.2 SQL Server数据挖掘体系结构概述 325

13.2.1数据挖掘设计环境 326

13.2.2构建、部署和处理 326

13.2.3挖掘模型的访问 326

13.2.4 Integration Services 和数据挖掘 327

13.2.5其他功能 327

13.2.6体系结构的总结 328

13.3 Microsoft数据挖掘的算法 328

13.3.1决策树 329

13.3.2 Naive Bayes算法 330

13.3.3群集 330

13.3.4顺序群集 330

13.3.5时间序列 331

13.3.6关联 331

13.3.7神经网络 331

13.4数据挖掘的过程 331

13.4.1业务阶段 332

13.4.2数据挖掘阶段 333

13.4.3操作阶段 339

13.4.4元数据 340

13.5数据挖掘的示例 340

13.5.1案例研究:给城市分类 341

13.5.2案例研究:产品推荐 349

13.6小结 362

第Ⅳ部分DW/Bl系统的部署和管理 365

第14章 设计和实施安全保护 365

14.1确定安全管理员 366

14.2保护硬件和操作系统 366

14.2.1保护操作系统 366

14.2.2使用Windows集成安全认证 367

14.3保护开发环境 367

14.4保护数据 368

14.4.1向内部用户提供开放的访问 368

14.4.2分条列出敏感数据 370

14.4.3保护各种类型的数据访问 370

14.5保护DW/BI系统的组件 371

14.5.1 Reporting Services安全 371

14.5.2 Analysis Services的安全 373

14.5.3关系DW的安全 381

14.5.4 Integration Services安全 385

14.6使用情况的监控 386

14.7小结 386

第15章 元数据规划 389

15.1元数据的基础 389

15.1.1元数据的目标 390

15.1.2元数据种类 390

15.1.3元数据库 390

15.2元数据标准 391

15.3 SQL Server 2008 R2元数据 392

15.3.1跨工具组件 395

15.3.2关系引擎的元数据 395

15.3.3 Analysis Services 395

15.3.4 Integration Services 396

15.3.5 Reporting Services 396

15.3.6 Master Data Services 397

15.3.7 SharePoint 397

15.3.8外部元数据的源 397

15.3.9对SQL Server元数据的期待 397

15.4实用的元数据方法 398

15.4.1元数据策略的创建 398

15.4.2业务元数据报表 399

15.4.3过程元数据报表设计 402

15.4.4技术元数据报表 403

15.4.5过程元数据的管理 403

15.5小结 403

第16章 部署 405

16.1建立环境 406

16.2测试 408

16.2.1开发测试 409

16.2.2系统测试 411

16.2.3数据质量保证的测试 413

16.2.4性能测试 414

16.2.5可用性的测试 416

16.2.6测试小结 417

16.3部署到生产环境中 418

16.3.1关系数据库的部署 418

16.3.2 Integration Services程序包的部署 420

16.3.3 Analysis Services数据库的部署 421

16.3.4 Reporting Services报表的部署 422

16.3.5 Master Data Services部署 423

16.4数据仓库和BI文档 424

16.4.1核心描述 424

16.4.2其他文档 425

16.5用户的培训 426

16.6用户支持 428

16.7台式计算机的准备和配置 429

16.8小结 430

第17章 运行与维护 431

17.1提供用户支持 432

17.1.1 BI门户的维护 433

17.1.2 BI应用程序的扩展 433

17.2系统管理 434

17.2.1 DW/BI系统的控制 434

17.2.2性能的监控 439

17.2.3使用情况的监控 444

17.2.4磁盘空间的管理 445

17.2.5服务和可用性的管理 446

17.2.6 DW/BI系统的性能调整 447

17.2.7备份和恢复 448

17.2.8 ETL程序包的执行 451

17.3小结 452

第18章 目前的需要及未来的展望 453

18.1发展DW/BI系统 453

18.2生命周期和常见的问题回顾 454

18.2.1阶段Ⅰ——需求、现实、体系结构和设计 455

18.2.2阶段Ⅱ——数据库的开发 455

18.2.3阶段Ⅲ——开发BI应用程序和门户环境 456

18.2.4阶段Ⅳ——DW/BI系统的部署和管理 456

18.2.5迭代和扩展 456

18.3 Microso BI工具集中受欢迎的部分 457

18.4未来的方向:改进的空间 457

18.4.1查询工具 458

18.4.2元数据 458

18.4.3关系数据库引擎 458

18.4.4 Analysis Services 459

18.4.5 Master Data Services 459

18.4.6集成 459

18.4.7顾客关注点 460

18.5小结 460

相关图书
作者其它书籍
返回顶部