数据仓库设计 现代原理与方法PDF电子书下载
- 电子书积分:13 积分如何计算积分?
- 作 者:(意)戈尔法雪利等著
- 出 版 社:北京:清华大学出版社
- 出版年份:2010
- ISBN:9787302230748
- 页数:393 页
第1章 数据仓库简介 1
1.1 决策支持系统 2
1.2 数据仓库 3
1.3 数据仓库的体系结构 6
1.3.1 单层体系结构 6
1.3.2 两层体系结构 7
1.3.3 三层体系结构 9
1.3.4 另一种体系结构类别 10
1.4 数据准备和ETL 12
1.4.1 提取 14
1.4.2 清洗 14
1.4.3 转换 14
1.4.4 加载 15
1.5 多维模型 16
1.5.1 限制 19
1.5.2 聚合 20
1.6 元数据 21
1.7 访问数据仓库 22
1.7.1 报表 22
1.7.2 OLAP 24
1.7.3 仪表板 29
1.8 ROLAP、MOLAP和HOLAP 30
1.9 其他问题 32
1.9.1 质量 32
1.9.2 安全 33
1.9.3 进化 33
第2章 数据仓库系统的生命周期 35
2.1 风险因素 35
2.2 自上而下与自下而上 36
2.2.1 商业维度生命周期 38
2.2.2 快速数据仓库方法 39
2.3 数据集市设计阶段 40
2.3.1 数据源的分析和协调 42
2.3.2 需求分析 42
2.3.3 概念设计 43
2.3.4 工作负荷细化和概念模式的验证 43
2.3.5 逻辑设计 43
2.3.6 物理设计 44
2.3.7 数据准备设计 44
2.4 系统方法架构 44
2.4.1 场景1:数据驱动的方法 45
2.4.2 场景2:需求驱动的方法 47
2.4.3 场景3:混合方法 47
2.5 测试数据集市 48
第3章 数据源的分析与协调 51
3.1 检查和规范化模式 53
3.2 集成问题 55
3.2.1 不同视角 56
3.2.2 等效建模构造 57
3.2.3 不兼容的规范 57
3.2.4 共有概念 58
3.2.5 相互关联的概念 59
3.3 集成阶段 59
3.3.1 预集成 60
3.3.2 比较模式 61
3.3.3 对齐模式 63
3.3.4 合并和重构模式 63
3.4 定义映射 65
第4章 用户需求分析 67
4.1 采访 68
4.2 基于词汇表的需求分析 70
4.2.1 事实 71
4.2.2 预备性工作负荷 73
4.3 面向目标的需求分析 75
4.3.1 Tropos简介 76
4.3.2 组织建模 78
4.3.3 决策建模 81
4.4 其他要求 83
第5章 概念建模 85
5.1 维度事实模型:基本概念 88
5.2 高级建模 93
5.2.1 描述性属性 94
5.2.2 跨维度属性 96
5.2.3 聚合 97
5.2.4 共享层次结构 97
5.2.5 多弧线 98
5.2.6 可选弧线 99
5.2.7 不完整层次结构 100
5.2.8 递归层次结构 101
5.2.9 可加性 102
5.3 事件和聚合 104
5.3.1 聚合可加性度量 107
5.3.2 聚合不可加度量 108
5.3.3 使用聚合和跨维度属性聚合 110
5.3.4 使用可选弧线或者多弧线聚合 111
5.3.5 空事实模式聚合 115
5.3.6 使用维度间的函数依赖进行聚合 116
5.3.7 沿着不完整或者递归层次结构聚合 116
5.4 时间 120
5.4.1 事务模式与快照模式 120
5.4.2 迟更新 123
5.4.3 动态层次结构 126
5.5 重叠事实模式 128
5.6 正式化维度事实模式 130
5.6.1 元模型 131
5.6.2 内涵特性 131
5.6.3 外延特性 133
第6章 概念设计 137
6.1 基于实体-关系模式的设计 138
6.1.1 定义事实 139
6.1.2 构建属性树 141
6.1.3 修剪和移植属性树 146
6.1.4 一对一关系 149
6.1.5 定义维度 150
6.1.6 时间维度 152
6.1.7 定义度量 154
6.1.8 生成事实模式 154
6.2 基于关系模式的设计 159
6.2.1 定义事实 160
6.2.2 构建属性树 160
6.2.3 其他阶段 164
6.3 基于XML模式的设计 166
6.3.1 建立XML关联模型 166
6.3.2 预备阶段 168
6.3.3 选择事实并构建属性树 169
6.4 混合方法设计 172
6.4.1 映射需求 172
6.4.2 构建事实模式 172
6.4.3 细化 174
6.5 需求驱动的方法设计 174
第7章 工作负荷和数据卷 177
7.1 工作负荷 178
7.1.1 维度表达式和对事实模式的查询 178
7.1.2 横向钻取查询 183
7.1.3 复合查询 186
7.1.4 嵌套GPSJ查询 186
7.1.5 验证概念模式中的工作负荷 187
7.1.6 工作负荷和用户 188
7.2 数据卷 190
第8章 逻辑建模 193
8.1 MOLAP和HOLAP系统 193
8.2 ROLAP系统 196
8.2.1 星型模式 197
8.2.2 雪花模式 199
8.3 视图 201
8.4 时间场景 206
8.4.1 动态层次结构:类型1 207
8.4.2 动态层次结构:类型2 208
8.4.3 动态层次结构:类型3 210
8.4.4 动态层次结构:完整数据记录 210
8.4.5 删除元组 213
第9章 逻辑设计 215
9.1 事实模式到星型模式 216
9.1.1 描述性属性 216
9.1.2 跨维度属性 216
9.1.3 共享层次结构 217
9.1.4 多弧线 218
9.1.5 可选弧线 221
9.1.6 不完整层次结构 222
9.1.7 递归层次结构 223
9.1.8 退化维度 225
9.1.9 可加性问题 227
9.1.10 使用雪花模式 228
9.2 视图实体化 229
9.2.1 使用视图来回答查询 233
9.2.2 问题公式化 234
9.2.3 实体化算法 237
9.3 视图碎片化 239
9.3.1 垂直视图碎片化 239
9.3.2 水平视图碎片化 242
第10章 数据准备设计 245
10.1 填充协调数据库 246
10.1.1 提取数据 247
10.1.2 转换数据 252
10.1.3 加载数据 253
10.2 清洗数据 254
10.2.1 基于字典的技术 255
10.2.2 近似合并 256
10.2.3 即席技术 258
10.3 填充维度表 258
10.3.1 确定要加载的数据 259
10.3.2 替换键 259
10.4 填充事实表 261
10.5 填充实体化视图 262
第11章 数据仓库的索引 265
11.1 B+树索引 265
11.2 位图索引 267
11.2.1 位图索引与B+树 269
11.2.2 高级位图索引 271
11.3 投影索引 274
11.4 联接和星型索引 275
11.5 空间索引 281
11.6 联接算法 282
11.6.1 嵌套循环 283
11.6.2 排序—合并 284
11.6.3 哈希联接 285
第12章 物理设计 287
12.1 优化器 287
12.1.1 基于规则的优化器 291
12.1.2 基于开销的优化器 294
12.1.3 直方图 296
12.2 选择索引 299
12.2.1 索引维度表 299
12.2.2 索引事实表 300
12.3 其他物理设计元素 301
12.3.1 将数据库划分为表空间 302
12.3.2 分配数据文件 303
12.3.3 磁盘块大小 306
第13章 数据仓库项目文档 309
13.1 数据仓库层 310
13.1.1 数据仓库模式 310
13.1.2 部署模式 311
13.2 数据集市层 314
13.2.1 总线矩阵和重叠矩阵 314
13.2.2 操作模式 315
13.2.3 数据准备模式 316
13.2.4 域术语表 321
13.2.5 工作负荷和用户 321
13.2.6 逻辑模式和物理模式 323
13.2.7 测试文档 325
13.3 事实层 326
13.3.1 事实模式 326
13.3.2 属性和度量术语表 326
13.4 系统方法指导原则 328
第14章 案例研究 331
14.1 应用领域 331
14.2 计划TranSport数据仓库 332
14.3 销售数据集市 332
14.3.1 数据源分析和协调 333
14.3.2 用户需求分析 344
14.3.3 概念设计 344
14.3.4 逻辑设计 350
14.3.5 数据准备设计 352
14.3.6 物理设计 353
14.4 营销数据集市 354
第15章 超越数据仓库范畴的商业智能 357
15.1 商业智能简介 357
15.2 数据挖掘 359
15.2.1 关联规则 361
15.2.2 群集化 362
15.2.3 分类器和决策树 363
15.2.4 时间序列 364
15.3 假设分析 364
15.3.1 归纳技术 365
15.3.2 演绎技术 366
15.3.3 系统方法注意事项 367
15.4 商业绩效管理 370
术语表 375
参考文献 381
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《设计十六日 国内外美术院校报考攻略》沈海泯著 2018
- 《计算机辅助平面设计》吴轶博主编 2019
- 《基于地质雷达信号波的土壤重金属污染探测方法研究》赵贵章 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《计算机组成原理解题参考 第7版》张基温 2017
- 《高校转型发展系列教材 素描基础与设计》施猛责任编辑;(中国)魏伏一,徐红 2019
- 《断陷湖盆比较沉积学与油气储层》赵永胜等著 1996
- 《液固旋流分离新技术》中国化工学会组织编写;汪华林等著 2019
- 《社会资本与村庄治理转型的社区机制》张国芳等著 2019
- 《回味从前》周作人,张亦庵,徐蔚南等著 2019
- 《星图 通往天空的旅程》(意)埃琳娜·帕西瓦迪 2019
- 《有机磷酸酯的暴露、毒性机制及环境风险评估》许宜平,王子健等著 2019
- 《鲍勃·迪伦》(意)马克·波利佐提著洪兵译 2020
- 《艺术中的经典文学形象与故事》(意)弗兰切斯卡·佩莱格里诺,(意)费代里科·皮波莱蒂 2019
- 《抗战与军队政治工作》李富春等著 1938
- 《给演员的简单手册》(意)达里奥·福,(意)弗兰卡·拉梅(Franca Rame)著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019