Microsoft数据仓库工具箱 使用SQL Server 2008 R2和Microsoft BI工具集PDF电子书下载
- 电子书积分:15 积分如何计算积分?
- 作 者:(美)蒙迪,(美)桑思韦特,(美)金博尔著
- 出 版 社:北京:清华大学出版社
- 出版年份:2012
- ISBN:9787302283362
- 页数:460 页
第Ⅰ部分 需求、现实情况和体系结构 3
第1章 定义业务需求 3
1.1长期成功的最重要的决定因素 4
1.2 Adventure Works Cycles简介 5
1.3揭示业务价值 5
1.3.1获得赞助商关系 6
1.3.2定义企业级业务需求 6
1.4设定业务需求的优先级 17
1.5项目规划 19
1.6收集项目需求 20
1.7小结 21
第2章 业务过程维度模型设计 23
2.1维度建模概念和术语 24
2.1.1事实表 25
2.1.2维度 26
2.1.3整合事实和维度 27
2.1.4总线矩阵、一致性维度和交叉探查 28
2.2其他设计概念和技术 30
2.2.1代理键 30
2.2.2渐变维度 31
2.2.3日期 32
2.2.4退化维度 33
2.2.5雪花模型 33
2.2.6多对多维度或多值维度 34
2.2.7层次结构 36
2.2.8聚合维度 38
2.2.9无意义维度 39
2.2.10 3种事实表类型 40
2.2.11聚合 41
2.3维度建模过程 41
2.3.1准备工作 42
2.3.2数据剖析和研究 45
2.3.3构建维度模型 47
2.3.4开发详细维度模型 50
2.3.5模型测试和细化 51
2.3.6评审和验证模型 51
2.4案例研究:Adventure Works Cycles订单维度模型 51
2.4.1订单事实表 51
2.4.2维度 52
2.4.3确定订单业务过程的维度属性和事实 54
2.4.4初始订单模型的最终草图 55
2.4.5详细订单维度模型开发 56
2.4.6最终的维度模型 57
2.5小结 57
第3章 工具集 59
3.1 Microso DW/BI工具集 60
3.2使用Microso工具集的原因 61
3.3 Microso DW/BI系统的体系结构 61
3.3.1包含nalysis Services的原因 63
3.3.2存储在关系数据库中的原因 64
3.3.3 ETL不是可选的 64
3.3.4 Master Data Services的作用 65
3.3.5交付BI应用程序 65
3.4 Microso工具概述 66
3.4.1需要的产品 66
3.4.2 SQL Server开发和管理工具 68
3.5小结 71
第4章 系统设置 73
4.1系统规模的考虑事项 74
4.1.1计算数据卷 74
4.1.2确定应用复杂度 75
4.1.3估计并发用户数 76
4.1.4评估系统可用性需求 77
4.1.5系统的规模 77
4.2系统配置考虑事项 77
4.2.1内存 77
4.2.2一体化还是分布式 78
4.2.3存储系统考虑事项 80
4.2.4处理器 83
4.2.5高可用性设置 83
4.3软件安装和配置 84
4.3.1开发环境的软件需求 85
4.3.2 测试和产品系统的软件需求 88
4.3.3操作系统 89
4.3.4 SQL Server关系数据库设置 89
4.3.5 Analysis Services设置 92
4.3.6 Integration Services设置 94
4.3.7 Repoing Services设置 95
4.4小结 96
第Ⅱ部分 建立和填充数据库 99
第5章 创建关系数据仓库 99
5.1开始 100
5.2完成物理设计 101
5.2.1代理键 101
5.2.2字符串列 101
5.2.3空或非空 102
5.2.4常规事务列 103
5.2.5数据表和列的扩展属性 104
5.3定义存储器并创建约束和支持对象 104
5.3.1创建文件和文件组 104
5.3.2数据压缩 105
5.3.3实体和引用完整性约束 106
5.3.4初始索引和数据库统计 107
5.3.5聚合表 109
5.3.6创建数据表视图 110
5.3.7插入未知成员行 111
5.3.8 CREATE TABLE语句示例 111
5.4分区表 112
5.4.1分区表的工作方式 112
5.4.2管理分区表 115
5.5收尾 119
5.5.1中间表 119
5.5.2元数据设置 119
5.6小结 120
第6章 主数据的管理 121
6.1管理主引用数据 122
6.1.1属性不完整 122
6.1.2数据集成 123
6.1.3系统集成 124
6.1.4主数据管理系统和数据仓库 125
6.2 SQL Server主数据服务 125
6.2.1模型定义功能 125
6.2.2数据管理功能 127
6.3创建简单的应用程序 131
6.3.1业务场景 131
6.3.2尽可能简单 131
6.3.3创建MDS模型 132
6.3.4加载子类别成员 134
6.3.5改进模型 135
6.3.6导出到数据仓库 136
6.4小结 136
第7章 设计和开发ETL系统 137
7.1确定需求 138
7.2制定ETL计划 139
7.3 SQL Server Integration Services概述 141
7.3.1控制流和数据流 142
7.3.2 SSIS程序包的体系结构 145
7.4 ETL的主要子系统 145
7.5提取数据 146
7.5.1子系统1:数据剖析 146
7.5.2子系统2:更改数据捕获系统 146
7.5.3子系统3:提取系统 148
7.6清理和一致化数据 151
7.6.1子系统4:数据清理系统 152
7.6.2子系统5:错误事件模式 158
7.6.3子系统6:审核维度汇编器 158
7.6.4子系统7:重复数据删除系统 159
7.6.5子系统8:一致化系统 160
7.7传递数据以用于展示 160
7.7.1子系统9:渐变维度管理器 161
7.7.2子系统10:代理键生成器 164
7.7.3子系统11:层次结构管理器 164
7.7.4子系统12:特殊维度管理器 165
7.7.5子系统13:事实表构建器 166
7.7.6子系统14:代理键管道 169
7.7.7子系统15:多值维度桥接表构建器 173
7.7.8子系统16:迟到数据的处理程序 173
7.7.9子系统17:维度管理器 175
7.7.10子系统18:事实提供程序系统 175
7.7.11子系统19:聚合构建器 175
7.7.12子系统20:OLAP多维数据集构建器 176
7.7.13子系统21:数据传播管理器 176
7.8管理ETL环境 176
7.9小结 178
第8章 核心Analysis Services OLAP数据库 181
8.1 Analysis Services OLAP概述 182
8.1.1使用Analysis Services的原因 183
8.1.2不使用Analysis Services的原因 184
8.2设计OLAP结构 185
8.2.1规划 185
8.2.2起始工作 187
8.2.3创建项目和数据源视图 188
8.2.4维度设计 190
8.2.5创建和编辑维度 193
8.2.6创建和编辑多维数据集 202
8.3物理设计的考虑因素 215
8.3.1理解存储模式 216
8.3.2分区计划 217
8.3.3设计性能聚合 219
8.3.4部署计划 220
8.3.5处理整个多维数据集 220
8.3.6开发增量处理计划 221
8.4小结 224
第9章 实时商业智能的设计需求 227
9.1实时分类 228
9.1.1实时的含义 228
9.1.2需要实时的人员 229
9.1.3对实时的权衡 229
9.2场景和解决方案 231
9.2.1实时地执行报表 232
9.2.2通过缓存向报表提供服务 232
9.2.3用镜像和快照创建ODS 233
9.2.4用复制功能创建ODS 233
9.2.5建立BizTalk应用程序 234
9.2.6建立实时关系分区 234
9.3小结 237
第Ⅲ部分 商业智能应用程序的开发 241
第10章在Repoing Seices中构建BI应用程序 241
10.1 BI应用程序概述 242
10.2商业智能应用程序的价值 243
10.3报表设计高层次的体系结构 244
10.3.1回顾报表设计的业务需求 245
10.3.2 Repoing Services的体系结构 246
10.3.3使用Repoing Services作为标准的报表设计工具 247
10.3.4 Repoing Services的评价 253
10.4报表设计系统的设计和开发过程 253
10.4.1报表设计系统的设计 254
10.4.2报表设计系统的开发 260
10.5报表的构建和传送 262
10.5.1规划和准备 262
10.5.2创建报表 264
10.5.3报表设计的运行 275
10.6即席报表设计选项 275
10.6.1报表模型 276
10.6.2共享数据集 277
10.6.3报表部件 277
10.7小结 277
第11章PowerPivot和Excel 279
11.1使用Excel进行分析和报表设计 280
11.2 PowerPivot体系结构 281
11.3创建和使用PowerPivot数据库 283
11.3.1开始使用PowerPivot 283
11.3.2 PowerPivot表的设计 284
11.3.3使用PowerPivot创建分析表 286
11.3.4 PowerPivot for Excel的观察和指导原则 291
11.4 PowerPivot for SharePoint 291
11.4.1 PowerPivot SharePoint用户体验 292
11.4.2服务器级别的资源 294
11.4.3 PowerPivot的监控和管理 295
11.5 PowerPivot在托管DW/BI环境下的作用 297
11.6小结 297
第12章BI门户和SharePoint 299
12.1 BI门户 300
12.1.1 BI门户的规划 300
12.1.2对设计的影响 301
12.1.3业务过程的类别 302
12.1.4额外的功能 302
12.1.5建立BI门户 303
12.2把ShaPoint用作BI门户 304
12.2.1体系结构和概念 305
12.2.2安装SharePoint 309
12.2.3安装测试系统 312
12.2.4完成BI门户 315
12.2.5 BIPortal站点模板的其他功能 315
12.2.6研究SharePoint 316
12.3小结 316
第13章 数据挖掘的加入 317
13.1数据挖掘的定义 318
13.1.1基本的数据挖掘术语 319
13.1.2数据挖掘的业务应用 320
13.1.3角色和责任 324
13.2 SQL Server数据挖掘体系结构概述 325
13.2.1数据挖掘设计环境 326
13.2.2构建、部署和处理 326
13.2.3挖掘模型的访问 326
13.2.4 Integration Services 和数据挖掘 327
13.2.5其他功能 327
13.2.6体系结构的总结 328
13.3 Microsoft数据挖掘的算法 328
13.3.1决策树 329
13.3.2 Naive Bayes算法 330
13.3.3群集 330
13.3.4顺序群集 330
13.3.5时间序列 331
13.3.6关联 331
13.3.7神经网络 331
13.4数据挖掘的过程 331
13.4.1业务阶段 332
13.4.2数据挖掘阶段 333
13.4.3操作阶段 339
13.4.4元数据 340
13.5数据挖掘的示例 340
13.5.1案例研究:给城市分类 341
13.5.2案例研究:产品推荐 349
13.6小结 362
第Ⅳ部分DW/Bl系统的部署和管理 365
第14章 设计和实施安全保护 365
14.1确定安全管理员 366
14.2保护硬件和操作系统 366
14.2.1保护操作系统 366
14.2.2使用Windows集成安全认证 367
14.3保护开发环境 367
14.4保护数据 368
14.4.1向内部用户提供开放的访问 368
14.4.2分条列出敏感数据 370
14.4.3保护各种类型的数据访问 370
14.5保护DW/BI系统的组件 371
14.5.1 Reporting Services安全 371
14.5.2 Analysis Services的安全 373
14.5.3关系DW的安全 381
14.5.4 Integration Services安全 385
14.6使用情况的监控 386
14.7小结 386
第15章 元数据规划 389
15.1元数据的基础 389
15.1.1元数据的目标 390
15.1.2元数据种类 390
15.1.3元数据库 390
15.2元数据标准 391
15.3 SQL Server 2008 R2元数据 392
15.3.1跨工具组件 395
15.3.2关系引擎的元数据 395
15.3.3 Analysis Services 395
15.3.4 Integration Services 396
15.3.5 Reporting Services 396
15.3.6 Master Data Services 397
15.3.7 SharePoint 397
15.3.8外部元数据的源 397
15.3.9对SQL Server元数据的期待 397
15.4实用的元数据方法 398
15.4.1元数据策略的创建 398
15.4.2业务元数据报表 399
15.4.3过程元数据报表设计 402
15.4.4技术元数据报表 403
15.4.5过程元数据的管理 403
15.5小结 403
第16章 部署 405
16.1建立环境 406
16.2测试 408
16.2.1开发测试 409
16.2.2系统测试 411
16.2.3数据质量保证的测试 413
16.2.4性能测试 414
16.2.5可用性的测试 416
16.2.6测试小结 417
16.3部署到生产环境中 418
16.3.1关系数据库的部署 418
16.3.2 Integration Services程序包的部署 420
16.3.3 Analysis Services数据库的部署 421
16.3.4 Reporting Services报表的部署 422
16.3.5 Master Data Services部署 423
16.4数据仓库和BI文档 424
16.4.1核心描述 424
16.4.2其他文档 425
16.5用户的培训 426
16.6用户支持 428
16.7台式计算机的准备和配置 429
16.8小结 430
第17章 运行与维护 431
17.1提供用户支持 432
17.1.1 BI门户的维护 433
17.1.2 BI应用程序的扩展 433
17.2系统管理 434
17.2.1 DW/BI系统的控制 434
17.2.2性能的监控 439
17.2.3使用情况的监控 444
17.2.4磁盘空间的管理 445
17.2.5服务和可用性的管理 446
17.2.6 DW/BI系统的性能调整 447
17.2.7备份和恢复 448
17.2.8 ETL程序包的执行 451
17.3小结 452
第18章 目前的需要及未来的展望 453
18.1发展DW/BI系统 453
18.2生命周期和常见的问题回顾 454
18.2.1阶段Ⅰ——需求、现实、体系结构和设计 455
18.2.2阶段Ⅱ——数据库的开发 455
18.2.3阶段Ⅲ——开发BI应用程序和门户环境 456
18.2.4阶段Ⅳ——DW/BI系统的部署和管理 456
18.2.5迭代和扩展 456
18.3 Microso BI工具集中受欢迎的部分 457
18.4未来的方向:改进的空间 457
18.4.1查询工具 458
18.4.2元数据 458
18.4.3关系数据库引擎 458
18.4.4 Analysis Services 459
18.4.5 Master Data Services 459
18.4.6集成 459
18.4.7顾客关注点 460
18.5小结 460
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《“十三五”规划教材 中药鉴定学实验 供中药学 药学及相关专业使用 第2版》吴啟南 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019