《关联数据 万维网上的结构化数据》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:(美)大卫·伍德(David Wood),玛莎·扎伊德曼著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2018
  • ISBN:9787115472649
  • 页数:252 页
图书介绍:本书以平实、通俗易懂的方式讲解了关联数据模型,并使用一些常用的工具讲解了一些关联数据的实用技术。本书在讲解基础概念的同时,会采用复杂度逐渐增加的案例来对其进行例证。读者将会学到使用各种关联数据的文档格式来创建强大的Web应用和marshup,以及高效使用这一新兴的Web标准在Web上访问、查询结构化的数据。

第1部分 关联数据网 2

第1章 关联数据简介 2

1.1关联数据定义 3

1.2关联数据并非万能 4

1.3关联数据实战 5

1.3.1释放数据 6

1.3.2关联数据在Google富摘要和Facebook“点赞”中的应用 6

1.3.3关联数据拯救了BBC 7

1.4关联数据原则 9

1.4.1第1原则:使用URI命名事物 10

1.4.2第2原则:使用HTTP URI以便于用户查找事物名称 10

1.4.3第3原则:在用户查找URI时提供有用的信息 11

1.4.4第4原则:包含指向其他URI的链接 12

1.5关联开放数据(LOD)项目 12

1.6数据描述 13

1.7 RDF:关联数据所用的数据模型 16

1.8关联数据应用程序剖析 18

1.8.1获取设施的关联数据 19

1.8.2通过关联数据创建UI 21

1.9小结 24

第2章RDF:关联数据所用的数据模型 25

2.1关联数据原则让RDF得以扩展 26

2.2 RDF数据模型 30

2.2.1三元组 31

2.2.2空节点 32

2.2.3类 33

2.2.4类型字面量 34

2.3 RDF词表 35

2.3.1通用词表 36

2.3.2自定义词表 39

2.4关联数据所用的RDF格式 40

2.4.1 Turtle:人类可读的RDF 41

2.4.2 RDF/XML:企业所用的RDF 44

2.4.3 RDFa:嵌入HTML网页的RDF 46

2.4.4 JSON-LD: JavaScript开发者所用的RDF 49

2.5与Web服务器和关联数据发布有关的问题 52

2.6文件类型与Web服务器 54

2.7对Apache服务器的控制有限时如何处理 55

2.8关联数据平台 56

2.9小结 56

第3章 使用关联数据 57

3.1像万维网一样思考 57

3.2如何使用关联数据 58

3.3查找分布式关联数据的工具 60

3.3.1 Sindice 60

3.3.2 SameAs.org 61

3.3.3 Data Hub 62

3.4聚合关联数据 63

3.4.1聚合已知数据集中的关联数据 63

3.4.2使用浏览器插件获取网页中的关联数据和RDF 67

3.5关联数据网的抓取与数据的聚合 69

3.5.1使用Python抓取关联数据网 69

3.5.2利用聚合后的RDF输出HTML 72

3.6小结 72

第2部分 关联数据进阶 74

第4章 利用FOAF创建关联数据 74

4.1创建个人FOAF配置文件 75

4.1.1 FOAF词表简介 76

4.1.2方法Ⅰ:手动创建基本的FOAF配置文件 77

4.1.3改进基本的FOAF配置文件 78

4.1.4方法Ⅱ:自动生成FOAF配置文件 80

4.2为FOAF配置文件添加更多内容 83

4.3发布FOAF配置文件 85

4.4 FOAF配置文件的可视化 86

4.5应用程序:采用自定义词表链接RDF文档 87

4.5.1创建愿望清单词表 87

4.5.2创建、发布并链接愿望清单文档 88

4.5.3为愿望清单文档添加内容 89

4.5.4小书签程序初探 91

4.6小结 92

第5章SPARQL:查询关联数据网 93

5.1典型SPARQL查询概述 94

5.2采用SPARQL查询扁平RDF文件 95

5.2.1查询单个RDF文件 95

5.2.2查询多个RDF文件 98

5.2.3查询万维网上的RDF文件 100

5.3查询SPARQL端点 100

5.4 SPARQL查询类型 102

5.4.1 SELECT查询 102

5.4.2 ASK查询 104

5.4.3 DESCRIBE查询 105

5.4.4 CONSTRUCT查询 105

5.4.5 SPARQL 1.1 Update 106

5.5 SPARQL结果格式(XML与JSON) 107

5.6利用SPARQL查询创建网页 108

5.6.1 创建SPARQL查询 109

5.6.2创建HTML页面 110

5.6.3创建JavaScript表格 111

5.6.4创建JavaScript地图 112

5.7小结 115

第3部分 关联数据实战 118

第6章 强化搜索引擎的结果 118

6.1通过嵌入RDFa以强化HTML 119

6.1.1利用FOAF词表添加RDFa标记 122

6.1.2在HTML span属性中使用RDFa 125

6.1.3从包含FOAF的HTML文档中提取关联数据 126

6.2采用GoodRelations词表嵌入RDFa 127

6.2.1 GoodRelations概述 127

6.2.2利用GoodRelations强化嵌入RDFa的HTML 130

6.2.3对选择RDFa GoodRelations的进一步观察 136

6.2.4从包含GoodRelations的HTML文档中提取关联数据 138

6.3采用Schema.org词表嵌入RDFa 141

6.3.1 Schema.org概述 141

6.3.2通过Schema.org强化使用RDFa Lite的HTML 143

6.3.3对利用Schema.org选择RDFa Lite的进一步观察 145

6.3.4从包含Schema.org的HTML文档中提取关联数据 147

6.4选择Schema.org还是GoodRelations 148

6.5从HTML中提取RDFa并执行SPARQL查询 149

6.6小结 150

第7章RDF数据库基础 151

7.1 RDF数据库分类 151

7.1.1 RDF数据库的选择 153

7.1.2 RDF数据库与关系数据库的比较 153

7.1.3 RDF数据库的优点 158

7.2将电子表格数据转换为RDF 159

7.2.1将MS Excel转换为RDF的简单示例 159

7.2.2将MS Excel转换为关联数据 161

7.2.3选择RDF转换工具 163

7.3应用程序:在RDF数据库中收集关联数据 163

7.3.1过程概述 163

7.3.2 利用Python聚合数据源 164

7.3.3理解输出 167

7.4小结 169

第8章 数据集 170

8.1 DOAP词表 171

8.1.1创建DOAP文件 172

8.1.2使用DOAP词表 174

8.2利用VoID记录数据集 178

8.2.1 VoID概述 178

8.2.2准备VoID文件 179

8.3站点地图 181

8.3.1非语义站点地图 182

8.3.2语义站点地图 183

8.3.3启用站点发现 185

8.4链接到其他用户的数据 187

8.5示例:利用owl:sameAs实现数据集之间的互联 193

8.6加入Data Hub 195

8.7从DBpedia请求指向用户数据集的出站链接 197

8.8小结 198

第4部分 归纳与整合 200

第9章Callimachus:关联数据管理系统 200

9.1 Callimachus入门 202

9.2使用RDF类创建网页 202

9.2.1为Callimachus添加数据 203

9.2.2向Callimachus通告OWL类 204

9.2.3将Callimachus视图模板与用户的类相互关联 205

9.3创建并编辑类实例 207

9.3.1新建笔记 208

9.3.2为笔记创建视图模板 210

9.3.3为笔记创建编辑模板 211

9.4应用程序:利用多个数据源创建网页 212

9.4.1利用NOAA和EPA创建并查询关联数据 213

9.4.2创建包含应用程序的网页 214

9.4.3创建用于检索和显示关联数据的JavaScript 217

9.4.4将代码段整合在一起 219

9.5小结 222

第10章 回顾发布关联数据 223

10.1准备数据 224

10.2构建URI 225

10.3选择词表 225

10.4自定义词表 226

10.5用户数据与其他数据集的互联 227

10.6发布数据 227

10.7小结 227

第11章 不断发展的万维网 228

11.1关联数据和语义网之间的关系 228

11.2未来展望 233

11.2.1 Google扩展富摘要 234

11.2.2数字问责和透明度立法 234

11.2.3广告的影响 234

11.2.4强化的搜索 234

11.2.5巨头的参与 235

11.3小结 235

附录A开发环境 236

附录B SPARQL结果格式 239

词汇表 245