当前位置:首页 > 工业技术
IBM数据仓库及IBM商务智能工具
IBM数据仓库及IBM商务智能工具

IBM数据仓库及IBM商务智能工具PDF电子书下载

工业技术

  • 电子书积分:17 积分如何计算积分?
  • 作 者:(美)Michael L.Gonzales著;吴刚,董志国等译
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2004
  • ISBN:7121000164
  • 页数:599 页
图书介绍:本书主要介绍了商务智能和数据仓库的一系列问题,如数据体系结构、技术体系结构、OLAP、数据挖掘、空间分析,以及抽取、转换和装载(ETL),更集中关注的是如何利用IBM的一系列应用广泛的成熟技术解决这些问题,例如,SMP和MPP技术体系结构、DB2通用数据库、DB2 OLAP Server数据管理技术、智能挖掘器、空间扩展器等。本书写作方向明确,主题清晰,兼顾了深度与广度,在彻底地剖析了商业智能之后,对使用IBM的关于建立、维护和挖掘数据仓库领域中的丰富产品族提出了颇具实用性的建议。本书可作为在公司中决策数据仓库所需工具和技术的决策者学习参考,也适于数据架构师、项目计划人或发起人阅读。
《IBM数据仓库及IBM商务智能工具》目录

第1部分 商务智能和数据仓库的基础知识 3

第1章 BI组织概述 3

1.1BI组织架构概述 4

1.2提供信息内容 8

1.2.1信息内容的计划 9

1.2.2信息内容的设计 12

1.2.3信息内容的实现 13

1.3证明BI工作的价值 16

1.3.1项目与已知的商务需求相结合 16

1.3.2衡量ROI 16

1.3.3让数据仓库首次迭代最大限度地发挥作用 19

1.4IBM和BI组织 20

1.4.1无缝集成 21

1.4.2简化数据传递系统 23

1.4.3零滞后 25

1.5小结 25

第2章 商务智能基础 27

2.1BI组成及技术 28

2.1.1BI组成 28

2.2数据仓库的组成 32

2.2.1数据抽取、转换和装载 34

2.2.2数据管理 37

2.2.3数据访问 37

2.2.4元数据 38

2.3分析化的用户要求 39

2.3.1报告和查询 40

2.3.2在线分析处理 40

2.3.3数据统计 43

2.3.4数据挖掘 43

2.4维度技术和BI 44

2.4.1OLAP服务器 45

2.4.2定义空间谱 47

2.5触点 48

2.6零滞后和数据仓库环境 49

2.7闭环学习 49

2.8历史完整性 50

2.9小结 53

第3章 设计数据仓库的迭代过程 54

3.1设计任何的迭代 55

3.1.1建立你自己的BI计划 57

3.2计划初期迭代 63

3.2.1设定数据仓库以符合公司战略 64

3.2.2实施一个准备就绪的评估 65

3.2.3源计划 66

3.3用DIF矩阵选择方案 69

3.3.1确定正确的方法 70

3.3.2应用DIF矩阵 70

3.3.3功能紊乱 74

3.3.5可行性 75

3.3.6DIF矩阵的结果 75

3.3.4影响力 75

3.4计划随后的迭代 78

3.4.1确定范围 78

3.4.2确定战略性的商务询问 79

3.5完成项目的方法 80

3.5.1BI骇客方法 80

3.5.2Inmon方法 81

3.5.3商务空间的生命周期方法 81

3.5.4螺旋形方法 82

3.5.5IBM方法 90

3.5.6选择合适的方法 93

3.6小结 93

第4章 设计数据架构 97

第2部分 商务智能架构 97

4.1选择正确的架构 99

4.1.1原子层选择 101

4.1.2数据集市 106

4.1.3有依赖性的数据集市的原子层 107

4.1.4独立的数据集市 109

4.1.5数据传输架构 110

4.2预测传送量 114

4.3架构建模 116

4.3.1商务逻辑模型 117

4.3.2原子层模型 118

4.3.3数据集市的建模 120

4.3.4原子和星型数据的比较 124

4.4可操作的数据的存储 125

4.5数据架构策略 126

4.6小结 129

第5章 技术架构和数据管理基础 131

5.1决定架构的技术依据 133

5.1.1集中的数据仓库 133

5.1.2分布式的数据仓库 137

5.1.3并行和仓库 139

5.1.4分区数据存储 142

5.2数据管理的技术基础 143

5.2.1DB2和原子层 143

5.2.2DB2和星型模式 148

5.3.1SMP、MPP和簇 150

5.3DB2技术架构的本质 150

5.3.2共享资源与无共享 152

5.3.3静态和动态并行 154

5.3.4目录分区 155

5.3.5高可用性 155

5.4尺寸需求 162

5.5小结 164

第3部分 数据管理 167

第6章 DB2BI基础 167

6.1高可用性 168

6.1.1MDC 168

6.1.2在线装载 169

6.1.3从游标处装载 170

6.1.4减少批处理窗口 171

6.1.5减少表重组 172

6.1.6在线装载和物化查询表(MQT)的维护 172

6.1.7MQT缓存表 173

6.1.8在线表重组 173

6.1.9动态缓冲池管理 175

6.1.10动态数据库配置 176

6.1.11数据库管理的存储空间 176

6.1.12日志 177

6.2管理 178

6.2.1eLiza和SMART 178

6.2.3AUTOCONFIGURE 179

6.2.2自动健康状态的管理框架 179

6.2.4管理通知日志 180

6.2.5维护模式 180

6.2.6事件监控程序 181

6.3SQL及其他编程特性 181

6.3.1INSTEADOF触发器 181

6.3.2经由UNIONAll的DML操作 182

6.3.3信息约束 183

6.3.4用户维护的MQT 183

6.4性能 184

6.4.1连接集中器 184

6.4.2压缩 185

6.4.4MDC性能改进 186

6.4.3Type-2索引 186

6.4.5缓冲池的分块 187

6.5可扩展性 187

6.5.1空间扩展 188

6.5.2文本扩展和文本信息扩展 188

6.5.3图形扩展 189

6.5.4XML扩展 189

6.5.5视频扩展和音频扩展 190

6.5.6网络查询扩展 190

6.5.7MQ序列 190

6.5.8DB2评分 191

6.6小结 192

第7章 DB2物化查询表 193

7.1初始化MQT 198

7.1.1建立 198

7.1.2泛化 198

7.1.3调整 200

7.1.4MQTDROP 200

7.2MQT刷新策略 200

7.2.1延时刷新 200

7.2.2立即刷新 204

7.3装载底层表格 206

7.3.1新状态 207

7.3.2新的LOAD选项 207

7.4使用DB2ALTER 210

7.5物化视图匹配 211

7.5.2匹配标准 212

7.5.1状态考虑 212

7.6MQT设计 222

7.7MQT调整 223

7.7.1刷新优化 224

7.8物化视图的限制 225

7.9小结 228

第4部分 数据仓库管理 231

第8章 利用IBMDB2DataWarehouseCenter管理数据仓库 231

8.1IBMDB2DataWarehouseCenter的关键特征 232

8.1.1仓库主题区 232

8.1.2仓库源 232

8.1.3仓库目标 232

8.1.5仓库代理程序和代理点 233

8.1.4仓库服务器和日志 233

8.1.6仓库控制数据库 234

8.1.7仓库过程和步骤 234

8.2IBMDB2DataWarehouseCenter向导(launchpad) 237

8.2.1设置数据仓库环境 238

8.2.2使用向导创建一个数据仓库 240

8.2.3在目标表中定义关键字 250

8.2.4维护数据仓库 250

8.2.5仓库的授权用户 251

8.2.6为用户编写仓库对象目录 251

8.3过程和步骤的任务流控制 252

8.3.1计划 253

8.3.2通知数据管理员 255

8.3.3计划一个过程 256

8.3.4在IBMDB2DataWarehouseCenter之外触发步骤 260

8.4IBMDB2DataWarehouseCenter监视战略 262

8.4.1IBMDB2DataWarehouseCenter监视工具 262

8.4.2DB2监视工具 271

8.4.3ReplicationCenter监视 272

8.5仓库调整 274

8.5.1更新统计数据 274

8.5.2重组数据 275

8.5.3使用DB2快照和监视器 275

8.5.4使用可视化解释 276

8.6维护IBMDB2DataWarehouseCenter 278

8.5.5调整数据库性能 278

8.6.1日志历史 279

8.6.2控制数据库 279

8.7DB2DataWarehouseCenterV8新增内容 279

8.8小结 282

第9章 在IBMDB2DataWarehouseCenter中进行数据变换 283

9.1IBMDB2DataWarehouseCenter过程模型 286

9.1.1确定数据源和目标 286

9.1.2确定变换 288

9.1.3过程模型 290

9.2IBMDB2DataWarehouseCenter变换 292

9.2.1刷新问题 294

9.2.2数据量 295

9.2.4用户定义的变换要求 296

9.2.5多个表的装载 296

9.2.3管理数据版本 296

9.2.6保证数据仓库中的数据是最新的 297

9.2.7重试 301

9.3SQL变换步骤 301

9.3.1SQL选择(Select)和插入(Insert) 303

9.3.2SQL选择(Select)和更新(Update) 304

9.4DB2实用程序 305

9.4.1导出实用程序的步骤 305

9.4.2装载实用程序的步骤 306

9.5数据仓库变换程序 308

9.5.1清洗变换程序 308

9.5.2产生关键字表格 310

9.5.3建立周期表 312

9.5.4倒转数据变换 314

9.5.5转动数据 316

9.5.6日期格式改变 319

9.5.7统计变换程序 320

9.6数据复制 336

9.6.1建立复制步骤 338

9.6.2在IBMDB2DataWarehouseCenter中定义复制步骤 341

9.7MQSeries集成 347

9.7.1对固定长度或定界格式的MQSeries信息的存取 348

9.7.2使用DB2MQSeries视图 350

9.7.3存取XMLMQSeries信息 351

9.8用户自定义的程序步骤 353

9.9卖方集成 355

9.9.1ETI·EXTRACT集成 356

9.9.2Trillium集成 364

9.9.3AscentialINTEGRITY 366

9.10MicrosoftOLEDB以及DataTransformationServices 367

9.10.1存取OLEDB 368

9.10.2存取DTS包 369

9.11小结 369

第10章 元数据和IBMDB2仓库管理器 371

10.1什么是元数据 371

10.2元数据分类 374

10.2.1按用户类型分类 374

10.2.2按来源的正式程度分类 375

10.3什么是元数据知识库 376

10.2.3按所使用环境分类 376

10.4供给元数据知识库 377

10.5元数据和元数据知识库的优势 378

10.6健康元数据知识库的特征 379

10.7维护知识库 380

10.8实施元数据知识库的难点 381

10.9IBM元数据技术 382

10.9.1信息目录 382

10.9.2IBMDB2DataWarehouseCenter 382

10.10由DWC获取元数据 384

10.10.1从ETI·EXTRACT中收集元数据 385

10.10.2从INTEGRITY中收集元数据 390

10.10.3从DataStage中收集元数据 393

10.10.4从ERwin中收集元数据 395

10.10.5从Axio中收集元数据 397

10.10.6从IBMOLAP集成服务器中收集元数据 398

10.11在IBMDB2DataWarehouseCenter实例之间交换元数据 401

10.11.1维护测试和产品系统 401

10.11.2元数据交换格式 402

10.12DWC元数据到其他工具的传送 405

10.12.1到IBM信息目录的DWC元数据传送 406

10.12.2到OLAP集成服务器的DWC元数据传送 408

10.12.3到IBMDB2OLAPServer的DWC元数据传送 410

10.12.4到AscentialINTEGRITY的DWC元数据传送 410

10.13把元数据从信息目录中传入或传出 411

10.13.1由信息目录获取元数据 412

10.13.2信息目录元数据传送 421

10.13.3向其他信息目录传送元数据 421

10.13.4启动Brio访问信息目录元数据 422

10.13.5把信息目录元数据传送到商业对象 423

1013.6把信息目录元数据传送到Cognos 423

10.14小结 424

第5部分 OLAP和IBM 427

第11章 多维数据和DB2OLAPServer 427

11.1理解OLAP的分析周期 432

11.2产生有效的度量 433

11.3OLAP技能 435

11.4.1用OLAP指导你的组织 437

11.4应用多维模型 437

11.4.2思维速度分析 438

11.5商务轮廓 438

11.6OLAP阵列 442

11.6.1关系型模式的局限 443

11.6.2衍生的测量 444

11.7实现企业的OLAP架构 445

11.8原型化(prototyping)数据仓库 447

11.8.1数据库设计:建立轮廓 448

11.8.2支持需求 455

11.9DB2OLAP矩阵数据库 455

11.9.1关于块的建立 457

11.10DB2OLAPServer大小需求 458

11.9.2矩阵的膨胀 458

11.10.1DB2OLAPServer存储什么 459

11.10.2使用SETMSGONLY:版本8之前的估计 460

11.10.3什么是典型数据 460

11.10.4DB2OLAPServerV8.0的大小估计 461

11.11数据库调整 462

11.11.1数据库调整的目标 463

11.11.2轮廓调整的要素 463

11.11.3批量计算和数据存储 464

11.11.4成员标签和动态计算 464

11.11.5磁盘子系统的应用和数据库文件的配置 466

11.11.6数据库分区 466

11.11.7属性维 467

11.12估计硬件的需求 468

11.12.1CPU估计 470

11.12.2磁盘估计 471

11.12.3OLAP辅助存储需求 471

11.13OLAP备份和灾难恢复 472

11.14小结 473

第12章 OLAP和IBMDB2DataWarehouseCenter 474

12.1IBMDB2DataWarehouseCenter的步骤类型 475

12.2将OLAP加入过程 476

12.2.1OLAPServer的主页 478

12.2.2OLAPServer列映射页 478

12.2.3OLAPServer程序过程选项 478

12.3OLAPServer装载规则 479

12.2.4其他考虑 479

12.3.1自由文本数据装载 480

12.3.2使用装载规则的文件装载 481

12.3.3不使用装载规则的文件装载 482

12.3.4使用装载规则的SQL表 483

12.4OLAPServer计算 484

12.4.1默认计算 484

12.4.2使用计算规则的计算 485

12.5更新OLAPServer轮廓 486

12.5.1使用文件 486

12.5.2使用SQL表 488

12.6小结 489

第13章 DB2OLAP函数 490

13.1OLAP函数 491

13.1.1具体函数 493

13.2GROUPING功能:ROLLUP和CUBE 496

13.2.1ROLLUP 497

13.2.2CUBE 498

13.3评级、定位和聚集 499

13.3.1RANK举例 500

13.3.2ROW_NUMBER,RANK和DENSE_RANK举例 501

13.3.3RANK和PARTITION及举例 502

13.3.4OVER语句举例 503

13.3.5ROWS和ORDERBY及举例 505

13.3.6ROWS,RANGE及ORDERBY举例 506

13.4.1GROUPING,GROUPBY和CUBE例子 508

13.4GROUPING,GROUPBY,ROLLUP和CUBE 508

13.4.2ROLLUP举例 509

13.4.3CUBE举例 513

13.5OLAP函数应用 516

13.5.1提供按地区和城市的年度销售额 517

13.5.2为一个活动确定目标群组 518

13.6小结 522

第6部分 高级分析 527

第14章 带智能挖掘器的数据挖掘 527

14.1数据挖掘和BI组织 528

14.1.1有效的数据挖掘 532

14.2挖掘过程 533

14.2.1步骤1:对一个商务问题进行精确的定义 535

14.2.2步骤2:商务问题到数据模型和数据需求的映射 537

14.2.3步骤3:源和预处理数据 538

14.2.4步骤4:考察和评估数据 539

14.2.5步骤5:选择数据挖掘技术 540

14.2.6步骤6:分析结果 541

14.2.7步骤7:运用结果 542

14.3集成数据挖掘 543

14.4实施数据挖掘工程的技术 544

14.5数据挖掘的好处 545

14.5.1数据质量 545

14.5.2相关维度 546

14.5.3在OLAP中使用挖掘结果 547

14.6挖掘DB2OLAPServer的好处 548

14.7小结 549

第15章 DB2——增强的BI特征和函数 550

15.1DB2分析函数 551

15.1.1AVG 551

15.1.2CORRELATION 552

15.1.3COUNT 552

15.1.4COUNT_BIG 552

15.1.5COVARIANCE 553

15.1.6MAX 553

15.1.7MIN 554

15.1.8RAND 554

15.1.10SUM 555

15.1.11VARIANCE 555

15.1.9STDDEV 555

15.1.12回归函数 556

15.1.13COVAR,CORR,VAR,STDDEV及回归举例 559

15.2以BI为中心的函数举例 565

15.2.1使用样本数据 565

15.2.2列举出地区今年领先的五个销售人员 568

15.2.3确定产品购买之间的关系 569

15.3小结 571

第16章 向数据仓库中添加空间数据 572

16.1空间分析和BI组织 573

16.2空间的影响 576

16.3什么是空间数据 578

16.3.2空间数据结构 579

16.3.1洋葱类比 579

16.3.3空间数据与其他图形数据的比较 581

16.4获取空间数据 582

16.4.1建立自己的空间数据 582

16.4.2引进空间数据 583

16.5DSS中的空间数据 585

16.6空间分析和数据挖掘 586

16.7空间分析的提供 588

16.7.1针对数据仓库的典型商务问题 590

16.8理解一个具有空间性能的数据仓库 594

16.8.1地址编码 595

16.8.2空间数据仓库的技术需求 596

16.8.3将空间数据加入数据仓库 598

16.9小结 599

返回顶部