《数据质量改进实践指南》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:(美)DavidLoshin著;曹建军,江春等译;刁兴春审校
  • 出 版 社:北京:国防工业出版社
  • 出版年份:2016
  • ISBN:9787118108132
  • 页数:308 页
图书介绍:本书系统阐述了完整数据质量改进计划的基本模块,重点关注组织方法、基本流程和技术角色,特别强调方法的可操作性和有效性,是一本非常优秀的数据质量实践专著,是当前最新的数据质量实践专著,书中使用了行业专业人士和IT专业人士都易于理解的术语,并且使用了读者能够对应到自己情况的具体实例和建议。该书汇集了作者David Loshin多年的数据质量研究成果与实践经验。

第1章 低劣数据质量的业务影响 1

1.1 信息价值与数据质量改进 2

1.2 业务期望指数与数据质量 3

1.3 减轻影响 4

1.4 若干实例 5

1.5 影响分类的进一步讨论 8

1.6 业务影响分析 10

1.7 其他影响类别 11

1.8 影响分类系统和迭代改进 12

1.9 小结:将影响转化为绩效 12

第2章 组织的数据质量计划 13

2.1 数据质量的良性循环 13

2.2 数据质量流程 15

2.3 利益相关者和参与者 20

2.4 数据质量工具 22

2.5 小结 25

第3章 数据质量成熟度 26

3.1 数据质量战略 26

3.2 数据质量框架 28

3.3 数据质量能力/成熟度模型 31

3.4 框架组件与成熟度模型的映射 33

3.5 小结 38

第4章 企业行动整合 39

4.1 规划行动 39

4.2 框架行动 44

4.3 操作和应用行动 45

4.4 范围问题 47

4.5 小结 48

第5章 建立业务案例和数据质量路线图 49

5.1 数据质量投资回报 50

5.2 建立业务案例 50

5.3 发现业务影响 51

5.4 研究成本 53

5.5 关联影响与原因 53

5.6 影响矩阵 54

5.7 问题、问题要点和原因 55

5.8 关联影响与数据缺陷 55

5.9 估算价值差距 56

5.10 划分优先级行动 58

5.11 数据质量路线图 59

5.12 建立路线图的实际步骤 61

5.13 责任、职责和管理 61

5.14 数据质量计划的生命周期 65

5.15 小结 66

第6章 度量指标和绩效改进 67

6.1 面向绩效的数据质量 67

6.2 建立数据质量度量指标 68

6.3 测量和关键数据质量绩效指标 71

6.4 统计过程控制 73

6.5 控制图 74

6.6 多种控制图 77

6.7 控制图说明 80

6.8 查找特殊原因 82

6.9 维护控制 82

6.10 小结 83

第7章 数据治理 84

7.1 企业数据质量论坛 85

7.2 数据质量章程 85

7.3 任务和指导原则 86

7.4 角色和职责 87

7.5 运营结构调整优化 90

7.6 数据统管 91

7.7 数据质量验证和认证 92

7.8 问题和解决方案 93

7.9 数据治理和联合社团 93

7.10 小结 94

第8章 数据质量维度 95

8.1 什么是数据质量维度 96

8.2 维度类别 96

8.3 数据质量维度描述 98

8.4 内在维度 99

8.5 上下文维度 102

8.6 定性维度 105

8.7 找出自己的维度 106

8.8 小结 107

第9章 数据需求分析 108

9.1 信息的企业用途和业务证析 109

9.2 业务驱动和数据依赖关系 111

9.3 什么是数据需求分析 112

9.4 数据需求分析流程 113

9.5 定义数据质量规则 117

9.6 小结 121

第10章 元数据与数据标准 122

10.1 挑战 123

10.2 数据标准 124

10.3 元数据管理 125

10.4 业务定义 126

10.5 参考元数据 128

10.6 数据元 131

10.7 业务元数据 134

10.8 数据协调流程 135

10.9 小结 137

第11章 数据质量评价 139

11.1 规划 140

11.2 业务流程评估 141

11.3 准备和数据分析 143

11.4 数据剖析和分析 145

11.5 分析结果的综合 147

11.6 企业客户审查 149

11.7 快速数据评价小结——明确的结果 150

第12章 修复和改进计划 151

12.1 按性质分类 152

12.2 信息流图 155

12.3 根本原因分析 157

12.4 修复 158

12.5 执行 159

12.6 小结 159

第13章 数据质量服务水平协议 160

13.1 业务驱动和成功准则 161

13.2 识别数据质量规则 163

13.3 建立数据质量控制 166

13.4 数据质量服务水平协议 166

13.5 检查和监测 168

13.6 数据质量度量指标和数据质量记分卡 169

13.7 数据质量事件报告和跟踪 170

13.8 自动化指标汇集 171

13.9 记分卡报告 172

13.10 采取修复行动 175

13.11 小结——管理使用数据质量记分卡 175

第14章 数据剖析 176

14.1 数据剖析的应用环境 177

14.2 数据剖析:算法技术 179

14.3 数据逆向工程 181

14.4 异常分析 182

14.5 数据质量规则发现 184

14.6 元数据合规性和数据模型完整性 186

14.7 协调参与者 187

14.8 选择分析数据集 188

14.9 小结 190

第15章 解析和标准化 191

15.1 数据错误范例 192

15.2 元数据的作用 193

15.3 标记:含义的单位 194

15.4 解析 196

15.5 标准化 198

15.6 定义规则和转换建议 199

15.7 主动与被动的矛盾 202

15.8 将数据转换整合进应用框架 203

15.9 小结 203

第16章 实体身份分辨 205

16.1 数据纠正的诱因 206

16.2 唯一身份的双重挑战 206

16.3 什么是实体 207

16.4 识别属性 208

16.5 相似度分析和匹配流程 209

16.6 匹配算法 210

16.7 虚报、漏报和阈值设定 212

16.8 保留 213

16.9 链接和保留监测 215

16.10 实体搜索与匹配和计算复杂度 215

16.11 身份分辨的应用 216

16.12 业务需求评估 217

16.13 小结 217

第17章 检查、监测、审核和跟踪 219

17.1 再谈数据质量服务水平协议 220

17.2 实行检查和监测:技术与流程 220

17.3 数据质量业务规则 223

17.4 自动检查和监测 225

17.5 事故报告、通知和问题管理 226

17.6 小结 228

第18章 数据增强 229

18.1 增强的价值 230

18.2 数据增强方法 230

18.3 数据增强的实例 231

18.4 通过标准化增强 233

18.5 通过上下文增强 234

18.6 通过数据合并增强 235

18.7 小结:符合规定的增强数据源 237

第19章 主数据管理和数据质量 238

19.1 什么是主数据 239

19.2 什么是主数据管理 240

19.3 “黄金记录”或“统一视图” 241

19.4 作为工具的主数据管理 241

19.5 主数据管理:一种高层组件方法 243

19.6 主数据使用场景 245

19.7 主数据管理架构 247

19.8 识别主数据 250

19.9 主数据服务 251

19.10 小结:走近主数据管理和数据质量 256

第20章 全书总结 257

20.1 组织和管理 257

20.2 建立信息质量计划 263

20.3 技术和工具 272

20.4 小结 279

索引 280