第一章 数据治理概述 1
1.1 数据治理背景 1
1.1.1 什么是数据 1
1.1.2 大数据 2
1.1.3 管理与治理 5
1.1.4 数据管理与数据治理 6
1.1.5 数据治理的大数据时代 8
1.2 数据治理相关概念 9
1.2.1 基本概念 9
1.2.2 数据治理框架 11
1.2.3 主数据 12
1.2.4 元数据 12
1.2.5 数据质量 13
1.2.6 数据集成 14
1.2.7 数据治理审计 15
1.2.8 数据治理团队组织 16
1.2.9 数据仓库 17
第二章 主数据 18
2.1 主数据概述 18
2.1.1 主数据定义 18
2.1.2 主数据特点 18
2.1.3 主数据应用业务场景 19
2.2 主数据管理 20
2.2.1 主数据管理概念 20
2.2.2 主数据管理的价值 21
2.3 主数据管理实施 23
2.3.1 实施规划 23
2.3.2 实施方法 24
2.4 主数据管理平台介绍 26
2.4.1 SAP 26
2.4.2 IBM 34
2.4.3 Oracle 41
2.4.4 Informatica 45
第三章 元数据 52
3.1 元数据概述 52
3.1.1 元数据定义 52
3.1.2 元数据特点 54
3.1.3 元数据作用 55
3.1.4 元数据标准 56
3.1.5 元数据生命周期 58
3.2 元数据管理 58
3.2.1 元数据管理目标 58
3.2.2 元数据管理的范畴 59
3.3.3 元数据管理的五级成熟度 60
3.3.4 元数据管理现状 63
3.3 元数据管理实施 63
3.3.1 元数据管理体系架构 63
3.3.2 元数据管理技术要求 65
3.4 元数据管理平台介绍 66
第四章 数据质量 76
4.1 数据质量概述 76
4.2 数据质量框架 78
4.2.1 框架 78
4.2.2 数据质量战略 80
4.2.3 质量控制目标 80
4.2.4 人员权利和职责 81
4.2.5 质量控制执行 81
4.2.5 基础支撑 82
4.3 数据质量管理实施 82
4.3.1 数据质量管理界定 83
4.3.2 数据质量测量 84
4.3.3 质量分析 85
4.3.4 质量改进 86
4.3.5 数据质量控制 87
4.4 数据质量管理七大工具 87
第五章 数据库原理 90
5.1 数据库概述 90
5.1.1 背景概念 90
5.1.2 数据管理技术发展阶段 91
5.1.3 数据库系统发展阶段 93
5.1.4 数据库系统研究方向 95
5.2 数据库原理 96
5.2.1 数据库系统结构 96
5.2.2 三级模式和二级映像 98
5.2.3 数据模型 99
5.2.4 数据库层次模型 101
5.2.5 数据库网状模型 102
5.2.6 数据库关系模型 104
5.2.7 E-R图 104
5.2.8 数据库存储原理 108
5.2.9 数据库索引技术 113
5.2.10 数据库安全 115
5.3 大数据库:NoSQL 118
5.3.1 NoSQL概述 118
5.3.2 NoSQL特点 119
5.3.3 NoSQL实例 120
第六章 数据集成 123
6.1 数据集成概述 123
6.1.1 数据集成主要技术 124
6.1.2 数据集成常见标准 126
6.2 数据清洗 127
6.2.1 数据清洗一般过程 128
6.2.2 缺失值处理 129
6.2.3 噪声处理 131
6.2.3 数据一致化 132
6.3 数据整理 132
6.3.1 数据整理概念 132
6.3.2 数据整理工作内容 133
第七章 数据治理的实施 136
7.1 数据治理的推动者与实施目标 136
7.1.1 推动者 136
7.1.2 数据治理目标 137
7.2 数据治理实施过程 139
7.2.1 机遇感知 139
7.2.2 现状分析 140
7.2.3 实施目标制定 140
7.2.4 实施方案制定 140
7.2.5 治理方案执行与监控 140
7.2.6 治理评估 141
7.2.7 治理实施增强 141
7.3 影响数据治理实施的重要因素 141
7.3.1 目标合理性 141
7.3.2 “数据价值”的企业文化 141
7.3.3 数据治理专岗专责 142
7.3.4 标准化 143
7.3.5 流程管理和控制 143
第八章 数据治理的审计 145
8.1 数据治理审计概述 145
8.1.1 背景 145
8.1.2 概念 146
8.1.3 审计内容 148
8.1.4 意义 150
8.2 数据治理审计关键要素 151
8.2.1 审计标准 151
8.2.2 审计方法 156
8.2.3 审计基础 158
8.3 数据治理审计流程 159
8.3.1 准备 159
8.3.2 实施 160
8.3.3 结束 161
8.3.4 后续增补审计 162
第九章 数据治理战略和团队建设 163
9.1 企业战略 163
9.1.1 理清业务需求 163
9.1.2 认清数据价值 164
9.1.3 科学制订战略 165
9.2 数据治理团队建设 165
9.2.1 团队角色 165
9.2.2 团队建设要素 166
9.2.3 数据治理企业组织实例 168
第十章 数据仓库概述 170
10.1 数据仓库背景 170
10.2 数据仓库的上下文环境 171
10.3 数据仓库的发展过程 179
10.4 数据仓库市场应用 184
第十一章 数据仓库模型设计 188
11.1 设计原则 188
11.2 三级数据模型 189
11.3 数据仓库模型设计步骤 190
11.3.1 概念模型设计 190
11.3.2 逻辑模型设计 191
11.3.3 物理模型设计 191
11.3.4 数据仓库建立策略 192
11.3.5 数据仓库运维 193
11.4 数据仓库维度建模 195
11.4.1 星型模式 195
11.4.2 雪花模式 196
11.4.3 事实星座模式 197
11.4.4 三种模式的关系 197
11.5 数据仓库模型设计实例 198
11.5.1 高校人员概念模型设计 198
11.5.2 高校人员逻辑模型设计 199
11.5.3 高校人员物理模型设计 200
参考文献 201