第1部分 商务智能和数据仓库的基础知识 3
第1章 BI组织概述 3
1.1BI组织架构概述 4
1.2提供信息内容 8
1.2.1信息内容的计划 9
1.2.2信息内容的设计 12
1.2.3信息内容的实现 13
1.3证明BI工作的价值 16
1.3.1项目与已知的商务需求相结合 16
1.3.2衡量ROI 16
1.3.3让数据仓库首次迭代最大限度地发挥作用 19
1.4IBM和BI组织 20
1.4.1无缝集成 21
1.4.2简化数据传递系统 23
1.4.3零滞后 25
1.5小结 25
第2章 商务智能基础 27
2.1BI组成及技术 28
2.1.1BI组成 28
2.2数据仓库的组成 32
2.2.1数据抽取、转换和装载 34
2.2.2数据管理 37
2.2.3数据访问 37
2.2.4元数据 38
2.3分析化的用户要求 39
2.3.1报告和查询 40
2.3.2在线分析处理 40
2.3.3数据统计 43
2.3.4数据挖掘 43
2.4维度技术和BI 44
2.4.1OLAP服务器 45
2.4.2定义空间谱 47
2.5触点 48
2.6零滞后和数据仓库环境 49
2.7闭环学习 49
2.8历史完整性 50
2.9小结 53
第3章 设计数据仓库的迭代过程 54
3.1设计任何的迭代 55
3.1.1建立你自己的BI计划 57
3.2计划初期迭代 63
3.2.1设定数据仓库以符合公司战略 64
3.2.2实施一个准备就绪的评估 65
3.2.3源计划 66
3.3用DIF矩阵选择方案 69
3.3.1确定正确的方法 70
3.3.2应用DIF矩阵 70
3.3.3功能紊乱 74
3.3.5可行性 75
3.3.6DIF矩阵的结果 75
3.3.4影响力 75
3.4计划随后的迭代 78
3.4.1确定范围 78
3.4.2确定战略性的商务询问 79
3.5完成项目的方法 80
3.5.1BI骇客方法 80
3.5.2Inmon方法 81
3.5.3商务空间的生命周期方法 81
3.5.4螺旋形方法 82
3.5.5IBM方法 90
3.5.6选择合适的方法 93
3.6小结 93
第4章 设计数据架构 97
第2部分 商务智能架构 97
4.1选择正确的架构 99
4.1.1原子层选择 101
4.1.2数据集市 106
4.1.3有依赖性的数据集市的原子层 107
4.1.4独立的数据集市 109
4.1.5数据传输架构 110
4.2预测传送量 114
4.3架构建模 116
4.3.1商务逻辑模型 117
4.3.2原子层模型 118
4.3.3数据集市的建模 120
4.3.4原子和星型数据的比较 124
4.4可操作的数据的存储 125
4.5数据架构策略 126
4.6小结 129
第5章 技术架构和数据管理基础 131
5.1决定架构的技术依据 133
5.1.1集中的数据仓库 133
5.1.2分布式的数据仓库 137
5.1.3并行和仓库 139
5.1.4分区数据存储 142
5.2数据管理的技术基础 143
5.2.1DB2和原子层 143
5.2.2DB2和星型模式 148
5.3.1SMP、MPP和簇 150
5.3DB2技术架构的本质 150
5.3.2共享资源与无共享 152
5.3.3静态和动态并行 154
5.3.4目录分区 155
5.3.5高可用性 155
5.4尺寸需求 162
5.5小结 164
第3部分 数据管理 167
第6章 DB2BI基础 167
6.1高可用性 168
6.1.1MDC 168
6.1.2在线装载 169
6.1.3从游标处装载 170
6.1.4减少批处理窗口 171
6.1.5减少表重组 172
6.1.6在线装载和物化查询表(MQT)的维护 172
6.1.7MQT缓存表 173
6.1.8在线表重组 173
6.1.9动态缓冲池管理 175
6.1.10动态数据库配置 176
6.1.11数据库管理的存储空间 176
6.1.12日志 177
6.2管理 178
6.2.1eLiza和SMART 178
6.2.3AUTOCONFIGURE 179
6.2.2自动健康状态的管理框架 179
6.2.4管理通知日志 180
6.2.5维护模式 180
6.2.6事件监控程序 181
6.3SQL及其他编程特性 181
6.3.1INSTEADOF触发器 181
6.3.2经由UNIONAll的DML操作 182
6.3.3信息约束 183
6.3.4用户维护的MQT 183
6.4性能 184
6.4.1连接集中器 184
6.4.2压缩 185
6.4.4MDC性能改进 186
6.4.3Type-2索引 186
6.4.5缓冲池的分块 187
6.5可扩展性 187
6.5.1空间扩展 188
6.5.2文本扩展和文本信息扩展 188
6.5.3图形扩展 189
6.5.4XML扩展 189
6.5.5视频扩展和音频扩展 190
6.5.6网络查询扩展 190
6.5.7MQ序列 190
6.5.8DB2评分 191
6.6小结 192
第7章 DB2物化查询表 193
7.1初始化MQT 198
7.1.1建立 198
7.1.2泛化 198
7.1.3调整 200
7.1.4MQTDROP 200
7.2MQT刷新策略 200
7.2.1延时刷新 200
7.2.2立即刷新 204
7.3装载底层表格 206
7.3.1新状态 207
7.3.2新的LOAD选项 207
7.4使用DB2ALTER 210
7.5物化视图匹配 211
7.5.2匹配标准 212
7.5.1状态考虑 212
7.6MQT设计 222
7.7MQT调整 223
7.7.1刷新优化 224
7.8物化视图的限制 225
7.9小结 228
第4部分 数据仓库管理 231
第8章 利用IBMDB2DataWarehouseCenter管理数据仓库 231
8.1IBMDB2DataWarehouseCenter的关键特征 232
8.1.1仓库主题区 232
8.1.2仓库源 232
8.1.3仓库目标 232
8.1.5仓库代理程序和代理点 233
8.1.4仓库服务器和日志 233
8.1.6仓库控制数据库 234
8.1.7仓库过程和步骤 234
8.2IBMDB2DataWarehouseCenter向导(launchpad) 237
8.2.1设置数据仓库环境 238
8.2.2使用向导创建一个数据仓库 240
8.2.3在目标表中定义关键字 250
8.2.4维护数据仓库 250
8.2.5仓库的授权用户 251
8.2.6为用户编写仓库对象目录 251
8.3过程和步骤的任务流控制 252
8.3.1计划 253
8.3.2通知数据管理员 255
8.3.3计划一个过程 256
8.3.4在IBMDB2DataWarehouseCenter之外触发步骤 260
8.4IBMDB2DataWarehouseCenter监视战略 262
8.4.1IBMDB2DataWarehouseCenter监视工具 262
8.4.2DB2监视工具 271
8.4.3ReplicationCenter监视 272
8.5仓库调整 274
8.5.1更新统计数据 274
8.5.2重组数据 275
8.5.3使用DB2快照和监视器 275
8.5.4使用可视化解释 276
8.6维护IBMDB2DataWarehouseCenter 278
8.5.5调整数据库性能 278
8.6.1日志历史 279
8.6.2控制数据库 279
8.7DB2DataWarehouseCenterV8新增内容 279
8.8小结 282
第9章 在IBMDB2DataWarehouseCenter中进行数据变换 283
9.1IBMDB2DataWarehouseCenter过程模型 286
9.1.1确定数据源和目标 286
9.1.2确定变换 288
9.1.3过程模型 290
9.2IBMDB2DataWarehouseCenter变换 292
9.2.1刷新问题 294
9.2.2数据量 295
9.2.4用户定义的变换要求 296
9.2.5多个表的装载 296
9.2.3管理数据版本 296
9.2.6保证数据仓库中的数据是最新的 297
9.2.7重试 301
9.3SQL变换步骤 301
9.3.1SQL选择(Select)和插入(Insert) 303
9.3.2SQL选择(Select)和更新(Update) 304
9.4DB2实用程序 305
9.4.1导出实用程序的步骤 305
9.4.2装载实用程序的步骤 306
9.5数据仓库变换程序 308
9.5.1清洗变换程序 308
9.5.2产生关键字表格 310
9.5.3建立周期表 312
9.5.4倒转数据变换 314
9.5.5转动数据 316
9.5.6日期格式改变 319
9.5.7统计变换程序 320
9.6数据复制 336
9.6.1建立复制步骤 338
9.6.2在IBMDB2DataWarehouseCenter中定义复制步骤 341
9.7MQSeries集成 347
9.7.1对固定长度或定界格式的MQSeries信息的存取 348
9.7.2使用DB2MQSeries视图 350
9.7.3存取XMLMQSeries信息 351
9.8用户自定义的程序步骤 353
9.9卖方集成 355
9.9.1ETI·EXTRACT集成 356
9.9.2Trillium集成 364
9.9.3AscentialINTEGRITY 366
9.10MicrosoftOLEDB以及DataTransformationServices 367
9.10.1存取OLEDB 368
9.10.2存取DTS包 369
9.11小结 369
第10章 元数据和IBMDB2仓库管理器 371
10.1什么是元数据 371
10.2元数据分类 374
10.2.1按用户类型分类 374
10.2.2按来源的正式程度分类 375
10.3什么是元数据知识库 376
10.2.3按所使用环境分类 376
10.4供给元数据知识库 377
10.5元数据和元数据知识库的优势 378
10.6健康元数据知识库的特征 379
10.7维护知识库 380
10.8实施元数据知识库的难点 381
10.9IBM元数据技术 382
10.9.1信息目录 382
10.9.2IBMDB2DataWarehouseCenter 382
10.10由DWC获取元数据 384
10.10.1从ETI·EXTRACT中收集元数据 385
10.10.2从INTEGRITY中收集元数据 390
10.10.3从DataStage中收集元数据 393
10.10.4从ERwin中收集元数据 395
10.10.5从Axio中收集元数据 397
10.10.6从IBMOLAP集成服务器中收集元数据 398
10.11在IBMDB2DataWarehouseCenter实例之间交换元数据 401
10.11.1维护测试和产品系统 401
10.11.2元数据交换格式 402
10.12DWC元数据到其他工具的传送 405
10.12.1到IBM信息目录的DWC元数据传送 406
10.12.2到OLAP集成服务器的DWC元数据传送 408
10.12.3到IBMDB2OLAPServer的DWC元数据传送 410
10.12.4到AscentialINTEGRITY的DWC元数据传送 410
10.13把元数据从信息目录中传入或传出 411
10.13.1由信息目录获取元数据 412
10.13.2信息目录元数据传送 421
10.13.3向其他信息目录传送元数据 421
10.13.4启动Brio访问信息目录元数据 422
10.13.5把信息目录元数据传送到商业对象 423
1013.6把信息目录元数据传送到Cognos 423
10.14小结 424
第5部分 OLAP和IBM 427
第11章 多维数据和DB2OLAPServer 427
11.1理解OLAP的分析周期 432
11.2产生有效的度量 433
11.3OLAP技能 435
11.4.1用OLAP指导你的组织 437
11.4应用多维模型 437
11.4.2思维速度分析 438
11.5商务轮廓 438
11.6OLAP阵列 442
11.6.1关系型模式的局限 443
11.6.2衍生的测量 444
11.7实现企业的OLAP架构 445
11.8原型化(prototyping)数据仓库 447
11.8.1数据库设计:建立轮廓 448
11.8.2支持需求 455
11.9DB2OLAP矩阵数据库 455
11.9.1关于块的建立 457
11.10DB2OLAPServer大小需求 458
11.9.2矩阵的膨胀 458
11.10.1DB2OLAPServer存储什么 459
11.10.2使用SETMSGONLY:版本8之前的估计 460
11.10.3什么是典型数据 460
11.10.4DB2OLAPServerV8.0的大小估计 461
11.11数据库调整 462
11.11.1数据库调整的目标 463
11.11.2轮廓调整的要素 463
11.11.3批量计算和数据存储 464
11.11.4成员标签和动态计算 464
11.11.5磁盘子系统的应用和数据库文件的配置 466
11.11.6数据库分区 466
11.11.7属性维 467
11.12估计硬件的需求 468
11.12.1CPU估计 470
11.12.2磁盘估计 471
11.12.3OLAP辅助存储需求 471
11.13OLAP备份和灾难恢复 472
11.14小结 473
第12章 OLAP和IBMDB2DataWarehouseCenter 474
12.1IBMDB2DataWarehouseCenter的步骤类型 475
12.2将OLAP加入过程 476
12.2.1OLAPServer的主页 478
12.2.2OLAPServer列映射页 478
12.2.3OLAPServer程序过程选项 478
12.3OLAPServer装载规则 479
12.2.4其他考虑 479
12.3.1自由文本数据装载 480
12.3.2使用装载规则的文件装载 481
12.3.3不使用装载规则的文件装载 482
12.3.4使用装载规则的SQL表 483
12.4OLAPServer计算 484
12.4.1默认计算 484
12.4.2使用计算规则的计算 485
12.5更新OLAPServer轮廓 486
12.5.1使用文件 486
12.5.2使用SQL表 488
12.6小结 489
第13章 DB2OLAP函数 490
13.1OLAP函数 491
13.1.1具体函数 493
13.2GROUPING功能:ROLLUP和CUBE 496
13.2.1ROLLUP 497
13.2.2CUBE 498
13.3评级、定位和聚集 499
13.3.1RANK举例 500
13.3.2ROW_NUMBER,RANK和DENSE_RANK举例 501
13.3.3RANK和PARTITION及举例 502
13.3.4OVER语句举例 503
13.3.5ROWS和ORDERBY及举例 505
13.3.6ROWS,RANGE及ORDERBY举例 506
13.4.1GROUPING,GROUPBY和CUBE例子 508
13.4GROUPING,GROUPBY,ROLLUP和CUBE 508
13.4.2ROLLUP举例 509
13.4.3CUBE举例 513
13.5OLAP函数应用 516
13.5.1提供按地区和城市的年度销售额 517
13.5.2为一个活动确定目标群组 518
13.6小结 522
第6部分 高级分析 527
第14章 带智能挖掘器的数据挖掘 527
14.1数据挖掘和BI组织 528
14.1.1有效的数据挖掘 532
14.2挖掘过程 533
14.2.1步骤1:对一个商务问题进行精确的定义 535
14.2.2步骤2:商务问题到数据模型和数据需求的映射 537
14.2.3步骤3:源和预处理数据 538
14.2.4步骤4:考察和评估数据 539
14.2.5步骤5:选择数据挖掘技术 540
14.2.6步骤6:分析结果 541
14.2.7步骤7:运用结果 542
14.3集成数据挖掘 543
14.4实施数据挖掘工程的技术 544
14.5数据挖掘的好处 545
14.5.1数据质量 545
14.5.2相关维度 546
14.5.3在OLAP中使用挖掘结果 547
14.6挖掘DB2OLAPServer的好处 548
14.7小结 549
第15章 DB2——增强的BI特征和函数 550
15.1DB2分析函数 551
15.1.1AVG 551
15.1.2CORRELATION 552
15.1.3COUNT 552
15.1.4COUNT_BIG 552
15.1.5COVARIANCE 553
15.1.6MAX 553
15.1.7MIN 554
15.1.8RAND 554
15.1.10SUM 555
15.1.11VARIANCE 555
15.1.9STDDEV 555
15.1.12回归函数 556
15.1.13COVAR,CORR,VAR,STDDEV及回归举例 559
15.2以BI为中心的函数举例 565
15.2.1使用样本数据 565
15.2.2列举出地区今年领先的五个销售人员 568
15.2.3确定产品购买之间的关系 569
15.3小结 571
第16章 向数据仓库中添加空间数据 572
16.1空间分析和BI组织 573
16.2空间的影响 576
16.3什么是空间数据 578
16.3.2空间数据结构 579
16.3.1洋葱类比 579
16.3.3空间数据与其他图形数据的比较 581
16.4获取空间数据 582
16.4.1建立自己的空间数据 582
16.4.2引进空间数据 583
16.5DSS中的空间数据 585
16.6空间分析和数据挖掘 586
16.7空间分析的提供 588
16.7.1针对数据仓库的典型商务问题 590
16.8理解一个具有空间性能的数据仓库 594
16.8.1地址编码 595
16.8.2空间数据仓库的技术需求 596
16.8.3将空间数据加入数据仓库 598
16.9小结 599