《数据质量工程实践 获取高质量数据和可信信息的十大步骤》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:(美)麦吉利夫雷著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2010
  • ISBN:9787121121609
  • 页数:285 页
图书介绍:本书将信息质量的概念框架和改善信息质量的技术、工具、操作指南相结合,提出并详细描述了获得高质量数据和可信信息的10个步骤,为提高信息质量提供了一套与业务无关的系统方法论(简称10步法)。本书在简述信息质量方法和介绍“10步流程”赖以建立的基本原理及概念的基础上,系统阐述了“10步流程”所包含的流程、指南、建议、实例和模板,讨论了信息质量项目的有关方法建议、时间安排和团队组建,介绍了方法论中的具体应用技术,还用简明易懂的形式对书中的重要概念、模板、术语等精华部分进行了归纳整理。

第1章 概述 1

信息和数据质量的影响 3

关于方法论的概念和步骤 5

工程中的数据质量方法 7

付诸管理 10

第2章 基本概念 13

引言 15

信息质量框架 15

信息生命周期 22

数据质量维度 28

业务影响技术 32

数据分类 36

数据规范 41

数据管治和数据统管 47

信息和数据质量提高周期 49

10步流程 51

最佳实践及指导方针 53

第3章 10步流程 57

引言 59

步骤1 定义业务需求和方法 61

引言 61

步骤1.1 确定业务问题优先次序 63

步骤1.2 项目规划 65

步骤2 分析信息环境 70

引言 70

步骤2.1 了解相关需求 74

步骤2.2 了解相关数据和规范 76

步骤2.3 了解相关技术 82

步骤2.4 了解相关流程 84

步骤2.5 了解相关人员/组织 87

步骤2.6 定义信息生命周期 90

步骤2.7 制订数据捕获和评估方案 92

步骤3 评估数据质量 96

引言 96

步骤3.1 数据规范 101

步骤3.2 数据完整性准则 105

步骤3.3 重复 112

步骤3.4 准确性 117

步骤3.5 一致性和同步 123

步骤3.6 及时性和有效性 126

步骤3.7 易用性和可维护性 129

步骤3.8 数据覆盖 130

步骤3.9 表达质量 131

步骤3.10 可理解性、相关性和可信度 135

步骤3.11 数据衰变 139

步骤3.12 效用性 141

步骤4 评估业务影响 143

引言 143

步骤4.1 事例 146

步骤4.2 用法 151

步骤4.3 业务影响的5个“为什么” 153

步骤4.4 费效矩阵 155

步骤4.5 排序和优先级划分 159

步骤4.6 流程影响 163

步骤4.7 低质量数据的代价 166

步骤4.8 费效分析 172

步骤5 确定根本原因 176

引言 176

步骤5.1 根本原因的5个“为什么” 178

步骤5.2 跟踪和回溯 180

步骤5.3 因果/鱼骨图 181

步骤6 制订提高方案 185

步骤7 预防未来数据错误 190

步骤8 纠正当前数据错误 194

步骤9 实施控制 198

步骤10 沟通行动和结果 203

10步流程小结 207

第4章 构建个人项目 213

项目和10个步骤 215

数据质量项目角色 226

项目时间安排 228

第5章 其他技术和工具 231

引言 233

信息生命周期方法 233

数据捕获 237

结果分析和归档 239

度量 242

数据质量工具 244

10个步骤和六西格玛 249

第6章 结尾 251

附录A 快速参考 255

信息质量框架 257

详细的POSMAD交互矩阵 258

POSMAD的阶段和行动 258

数据质量维度 260

业务影响技术 261

10步流程概述 261

数据分类的定义 263

术语表 265

参考文献 277

图、表和模板列表 281