《基于PROV模型的数据溯源》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:倪静著;孟宪学审
  • 出 版 社:北京:中国石化出版社
  • 出版年份:2017
  • ISBN:9787511445711
  • 页数:128 页
图书介绍:本书介绍了作者近年来针对语义Web下数据溯源的理论与方法的最新研究成果。从目前语义Web研究中存在的瓶颈入手,以语义Web、数据溯源、关联数据为理论基础,以语义Web应用为研究目标,开展了语义Web环境下数据溯源模型的 比较研究,构建了PROV模型的应用情境,验证了PROV本体描述的起源记录在未来Web应用中的语义表达和查询服务问题,提出了一种借助PROV本体自动化发现相似网页起源关系的实现方法。

1 绪论 1

1.1 Web向语义的Web演进及数据溯源 1

1.2 国内外研究进展 3

1.2.1 国外研究进展 3

1.2.2 国内研究进展 11

1.2.3 数据溯源面临的问题 14

1.3 本书要解决的问题 14

2 数据溯源基础 23

2.1 数据溯源定义 23

2.1.1 词典对数据溯源的定义 23

2.1.2 W3C对数据溯源的定义 23

2.2 数据溯源相关概念辨析 24

2.2.1 数据溯源与元数据比较 24

2.2.2 数据溯源与信任计算关系 24

2.3 数据溯源分类 25

2.3.1 基于数据库的数据溯源 25

2.3.2 基于科学工作流的数据溯源 26

2.3.3 网络环境下的数据溯源 28

2.3.4 语义网环境下的数据溯源 29

2.4 起源孵化组织及OPM映射 30

2.5 数据起源追溯的一般方法 31

2.6 数据起源的应用 32

3 数据溯源模型比较 39

3.1 数据溯源模型及构成元素 39

3.1.1 DCMI元数据术语 39

3.1.2 OPM模型 40

3.1.3 PV模型 42

3.1.4 VoIDP溯源模型 42

3.1.5 PROV本体模型 43

3.2 数据溯源模型多角度比较 44

3.2.1 来源和目的的比较 45

3.2.2 资源描述角度的比较 46

3.2.3 主要服务对象和解决问题的比较 46

3.2.4 标注方式的比较 46

3.2.5 词汇表结构的比较 46

3.3 本章小结 47

4 PROV模型在Web中的应用 50

4.1 W3C的PROV系列标准 50

4.2 PROV模型的构建角度与核心构成要素分析 51

4.2.1 PROV模型的构建角度 51

4.2.2 PROV模型的核心构成要素分析 51

4.3 基于PROV的应用情境和应用模型构建 54

4.3.1 实体分析和代码描述 54

4.3.2 活动分析和代码描述 55

4.3.3 利用和产生分析和代码描述 55

4.3.4 代理和责任分析和代码描述 55

4.3.5 角色分析和代码描述 56

4.3.6 衍生和修订分析和代码描述 58

4.3.7 计划分析和代码描述 58

4.3.8 时间分析和代码描述 59

4.3.9 可替代的实体、特例(泛化)分析和代码描述 59

4.4 PROV模型的Web应用特征分析 60

4.5 本章小结 61

5 Web应用中溯源本体的信息定位和查询机制 63

5.1 起源记录的识别 64

5.1.1 资源与信息资源的关系 64

5.1.2 起源、起源记录、起源URI及目标URI的关系 64

5.2 起源记录的定位 65

5.2.1 将起源加入HTTP头文件 66

5.2.2 将起源嵌入内容表达 68

5.3 数据起源的查询服务机制 69

5.3.1 直接的HTTP查询服务 69

5.3.2 SPARQL查询服务 70

5.4 实例验证 70

5.4.1 采用RDFa将PROV本体嵌入HTML网页 71

5.4.2 采用HTTP查询服务实现查询 74

5.5 本章小结 75

6 基于PROV本体模型的Web内容溯源 77

6.1 相关研究 77

6.2 基于Web文本内容的溯源模型构建 78

6.2.1 PROV模型在研究中的重用 78

6.2.2 PROV溯源模型的扩展——PROV-POL模型 79

6.3 网页文本内容的起源自动发现方案 80

6.3.1 网页文本内容的变化特征 80

6.3.2 网页文本内容的起源自动发现方案 80

6.3.3 网页文本内容起源自动发现的实现机理 81

6.4 案例实现的关键步骤 84

6.4.1 聚类前处理过程 84

6.4.2 文本聚类及相似度计算 85

6.4.3 相似文本的自动语义标注 85

6.4.4 属性级网页文本溯源 86

6.5 基于网页文本内容追溯的实验与结果分析 87

6.5.1 数据预处理及实验结果 87

6.5.2 实验结果评价 91

6.6 本章小结 91

7 关联数据的数据溯源 94

7.1 关联数据发布的特征 94

7.1.1 不同提供者可在同一命名空间发布数据 94

7.1.2 数据连接和数据维护的特征 95

7.1.3 关联数据是一个数据供应链 95

7.1.4 关联数据往往由第三方发布 95

7.2 溯源实体的选择 96

7.2.1 数据、元数据和元数据溯源的关系 96

7.2.2 有状态和无状态资源的选择 96

7.3 溯源粒度的选择 97

7.3.1 基于命题的溯源元数据 97

7.3.2 基于数据集的溯源元数据 98

7.4 关联数据发布工具选择 98

7.4.1 D2R SERVER 99

7.4.2 Sparql终端查询 100

7.5 溯源的方法 100

7.6 基于D2R教学科研数据集的发布框架 101

7.7 案例验证 102

7.7.1 现有的教学和科研数据库表结构 102

7.7.2 语义扩展、复用公共本体和溯源本体 102

7.7.3 界面实现 110

7.7.4 基于数据集的溯源元数据配置 113

7.8 本章小结 114

8 PROV模型的应用趋势 115

附录1 分类方法部分源代码 118

附录2 英文缩略表 121

附录3 利用D2R生成的部分映射文件 122