第1章 数据虚拟化导论 1
1.1 引言 1
1.2 商务智能世界正在改变 1
1.3 虚拟化简介 3
1.4 什么是数据虚拟化 3
1.5 数据虚拟化与相关概念 4
1.5.1 数据虚拟化与封装和信息隐藏 4
1.5.2 数据虚拟化与抽象 5
1.5.3 数据虚拟化与数据联合 5
1.5.4 数据虚拟化与数据集成 6
1.5.5 数据虚拟化与企业信息集成 7
1.6 数据虚拟化的定义 8
1.7 数据虚拟化的技术优势 8
1.8 数据虚拟化的不同实现 11
1.9 数据虚拟化服务器概述 12
1.10 开放式与封闭式数据虚拟化服务器 12
1.11 数据集成的其他方式 13
1.12 数据虚拟化服务模型 15
1.13 数据虚拟化的历史 16
1.14 示例数据库:世界一流电影 18
1.15 本书结构 20
第2章 商务智能和数据仓库 22
2.1 引言 22
2.2 什么是商务智能 22
2.3 管理层次与决策制定 23
2.4 商务智能系统 23
2.5 商务智能系统的数据存储 24
2.5.1 数据仓库 25
2.5.2 数据集市 27
2.5.3 数据中转区 28
2.5.4 可操作数据存储 29
2.5.5 个人数据存储 30
2.5.6 不同类型数据存储的对比 31
2.6 标准化模式、星形模式和雪花模式 31
2.6.1 标准化模式 32
2.6.2 非标准化模式 32
2.6.3 星形模式 33
2.6.4 雪花模式 34
2.7 提取-转换-装载、提取-装载-转换和复制 35
2.7.1 提取-转换-装载 36
2.7.2 提取-装载-转换 37
2.7.3 复制 38
2.8 商务智能架构总览 38
2.9 报告和分析的新形式 39
2.9.1 运营报告和分析 39
2.9.2 深度和大数据分析 40
2.9.3 自助式报告和分析 40
2.9.4 无限制的自组织分析 40
2.9.5 360°报告 41
2.9.6 探索性分析 42
2.9.7 基于文本的分析 42
2.10 传统商务智能系统的劣势 43
2.11 总结 46
第3章 数据虚拟化服务器:构造模块 47
3.1 引言 47
3.2 数据虚拟化服务器的高层架构 47
3.3 导入源表和定义封装器 48
3.4 定义虚拟表和映射 50
3.5 虚拟表和映射的例子 53
3.6 虚拟表和数据建模 59
3.7 嵌套虚拟表和共享规范 61
3.8 导入非关系数据 62
3.8.1 XML和JSON文档 62
3.8.2 Web服务 66
3.8.3 电子表格 66
3.8.4 NoSQL数据库 68
3.8.5 多维数据集和MDX 70
3.8.6 半结构化数据 71
3.8.7 非结构化数据 74
3.9 发布虚拟表 75
3.10 互联网数据模型 80
3.11 可更新的虚拟表和事务管理 82
第4章 数据虚拟化服务器:管理与安全 85
4.1 引言 85
4.2 影响度和线性分析 85
4.3 源表、封装表和虚拟表的同步 87
4.4 数据安全:认证与授权 88
4.5 监控、管理和实施 89
第5章 数据虚拟化服务器:虚拟表的高速缓存 93
5.1 引言 93
5.2 虚拟表的高速缓存 93
5.3 什么时候使用高速缓存 95
5.4 高速缓存与数据集市 95
5.5 高速缓存保存在哪里 96
5.6 刷新高速缓存 97
5.7 完整刷新、增量刷新和动态刷新 97
5.8 在线刷新与离线刷新 98
5.9 高速缓存备份 98
第6章 数据虚拟化服务器:查询优化技术 100
6.1 引言 100
6.2 查询优化的基本原理 101
6.3 数据虚拟化服务器查询处理的10个阶段 104
6.4 数据存储的智能等级 105
6.5 通过查询替换进行优化 106
6.6 下推优化 107
6.7 查询扩展(查询注入)优化 109
6.8 运送连接优化 110
6.9 合并排序连接优化 111
6.10 缓存优化 111
6.11 数据优化与统计 112
6.12 提示优化 112
6.13 SQL覆盖优化 113
6.14 处理策略的说明 114
第7章 在商务智能系统上部署数据虚拟化 115
7.1 引言 115
7.2 基于数据虚拟化的商务智能系统 115
7.3 部署数据虚拟化的优点 116
7.4 部署数据虚拟化的缺点 118
7.5 采用数据虚拟化的策略 119
7.5.1 策略1:在现有的商务智能系统上引入数据虚拟化 119
7.5.2 策略2:利用数据虚拟化开发新的商务智能系统 123
7.5.3 策略3:开发新的结合源数据和转换数据的商务智能系统 127
7.6 数据虚拟化的应用领域 127
7.6.1 统一的数据访问 127
7.6.2 虚拟数据集市 128
7.6.3 虚拟数据仓库——基于数据集市 130
7.6.4 虚拟数据仓库——基于生产数据库 130
7.6.5 扩展数据仓库 131
7.6.6 操作报告和分析 131
7.6.7 操作数据仓库 133
7.6.8 虚拟企业数据仓库 133
7.6.9 自助服务报告和分析 134
7.6.10 虚拟沙盒 134
7.6.11 原型设计 135
7.6.12 分析半结构化和非结构化数据 135
7.6.13 一次性报告 136
7.6.14 通过外部用户扩展的商务智能系统 136
7.7 关于数据虚拟化的谬论 138
第8章 数据虚拟化设计指南 140
8.1 引言 140
8.2 错误数据和数据质量 140
8.2.1 错误数据的不同形式 141
8.2.2 完整性规则和错误数据 142
8.2.3 过滤、标记和恢复错误数据 142
8.2.4 过滤错误数据的例子 143
8.2.5 标记错误值示例 145
8.2.6 恢复拼写错误数据示例 146
8.3 复杂和不规则的数据结构 148
8.3.1 没有名字的代码 150
8.3.2 键值不一致 150
8.3.3 重复组 151
8.3.4 递归数据结构 153
8.4 实现封装或映射中的转换 155
8.5 分析错误数据 155
8.6 不同的用户和不同的定义 156
8.7 数据时间的不一致性 157
8.8 数据存储和数据传输 158
8.9 生产系统数据检索 159
8.10 加入历史和业务数据 160
8.11 处理组织的变化 161
8.12 数据归档 162
第9章 数据虚拟化和服务导向架构 163
9.1 引言 163
9.2 服务导向架构概述 163
9.3 基本服务、组合服务、业务流程服务和数据服务 165
9.4 使用数据虚拟化服务器开发数据服务 166
9.5 使用数据虚拟化服务器开发组合服务 167
9.6 服务和内部数据模型 169
第10章 数据虚拟化和主数据管理 171
10.1 引言 171
10.2 数据是任何组织的关键资产 171
10.3 业务对象的360°视图需求 172
10.4 什么是主数据 173
10.5 什么是主数据管理 175
10.6 主数据管理系统 175
10.7 通过主数据管理集成的数据 177
10.8 主数据管理和数据虚拟化的结合 178
第11章 数据虚拟化、信息管理和数据管理 182
11.1 引言 182
11.2 数据虚拟化对信息建模和数据库设计的影响 182
11.3 数据虚拟化对数据分析的影响 185
11.4 数据虚拟化对数据清洗的影响 188
11.5 数据虚拟化对数据管理的影响 189
第12章 数据交付平台:新型商务智能系统架构 191
12.1 引言 191
12.2 数据交付平台简介 191
12.3 数据交付平台的定义 192
12.4 数据交付平台和其他商务智能架构 193
12.5 数据交付平台的需求 194
12.6 数据交付平台与数据虚拟化 196
12.7 DDP名称说明 197
12.8 个人见解 197
第13章 数据虚拟化的未来 199
13.1 引言 199
13.2 数据虚拟化的未来——RickF.van der Lans 200
13.2.1 新的和增强的查询优化技术 200
13.2.2 利用新的硬件技术 201
13.2.3 扩展设计模块 201
13.2.4 数据质量特征 203
13.2.5 支持用于数据访问的推模型 203
13.2.6 混合数据虚拟化、提取-转换-装载、提取-装载-转换和复制 204
13.3 数据虚拟化的未来——David Besemer(Composite Software公司CTO) 205
13.3.1 授权的消费者获得了无所不在的数据访问 205
13.3.2 IT的后台成为云 206
13.3.3 数据虚拟化的未来是全球数据结构 206
13.3.4 结论 207
13.4 数据虚拟化的未来——Alberto Pan(Denodo Technologies公司CTO) 207
13.5 数据虚拟化的未来——James Markarian(Informatica公司CTO) 209
13.5.1 怎样通过数据虚拟化使数据回报最大化 209
13.5.2 深入探索隐藏在表面下的东西 210
参考文献 211