《中文链接数据构建实施路径研究》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:王汀,徐天晟著
  • 出 版 社:北京:科学出版社
  • 出版年份:2015
  • ISBN:9787030446930
  • 页数:103 页
图书介绍:关联数据(LinkedOpenData,LOD)项目作为语义网发展的重要组成部分,其目标是将web上已经发布的语义数据集之间进行最大限度的关联,以使得各自孤立的语义知识点可以互相关联进而最终形成大规模知识网络,从而使得知识共享和语义互操作成为可能,同时,如果将分散的数据源链接起来形成一个互联的数据之网,则形成的知识网络就会具有更高的价值,由此便可催生不同领域的网络新应用出现。自从万维网之父TimBerners-Lee提出关联数据的概念至今,相关研究已经越来越来受到学者的关注。本研究重点关注关联数据构建的理论依据及其关键技术,主要包括以下研究内容和创新点:(1)提出一种领域叙词表与网络百科知识库相融合的两阶段领域本体自动化构建方法。(2)提出一种面向中文网络百科非结构化信息的知识获取方法。(3)提出一种新的面向中文大规模本体映射模型的总体框架。(4)提出了一种对大规模本体映射规模进行压缩约简的新方法。(5)提出一种基于生物信息学双序列比对的概念语义相似度计算新方法。本研究提出的方法对中文关联数据构建及新应用的研发有重要的帮助。提出的新方法和架构模型可以被应用于自然语言处理系统中的语义知识

第1章 绪论 1

1.1研究背景与意义 1

1.2国内外研究现状 4

1.2.1语义Web相关研究进展 4

1.2.2本体自动化构建的研究进展 8

1.2.3知识库构建的研究进展 10

1.2.4关联数据构建的研究进展 13

1.3所面临的主要问题 18

1.4研究思路和创新点 19

1.4.1研究的总体思路及理论框架 19

1.4.2课题来源与研究内容 20

1.5组织结构 22

第2章 相关技术与系统 25

2.1语义Web技术概述 25

2.2本体构建的相关技术 27

2.2.1本体构建技术概述 27

2.2.2本体与知识库的区别与联系 32

2.3中文网络百科系统概述 33

2.3.1百度百科 34

2.3.2互动百科 36

2.3.3语义化的维基百科——DBpedia 37

2.3.4在线百科结构 38

2.3.5三大中文网络百科系统的比较分析 39

2.4关联数据技术的领域应用 40

2.5本章小结 43

第3章 领域本体的自动化构建 44

3.1引言 44

3.2相关工作 45

3.3背景介绍 46

3.3.1叙词表 46

3.3.2百度百科知识库 51

3.3.3相关定义 51

3.4系统总体架构 53

3.5叙词表至本体的粗映射(Fuzzy Mapping) 54

3.6领域粗糙本体与百科知识的融合 56

3.6.1概念的映射与裁剪 56

3.6.2百科Infobox中属性的自动抽取 57

3.6.3粗糙本体的自适应调整与扩充 61

3.6.4领域本体中的属性定义 62

3.6.5领域本体实例的快速填充 64

3.7本章小结 64

第4章 面向中文网络百科非结构化信息的知识获取 66

4.1引言 66

4.2相关工作 67

4.3语义网知识库特性 68

4.4总体设计 69

4.5训练样本的获取 71

4.5.1获取Infobox信息框中的三元组知识 71

4.5.2候选句子的获取 71

4.5.3语义关联词汇实体标注 72

4.6基于CRF-SVM协同分类器的网络百科知识获取 74

4.6.1条件随机场和支持向量机模型 75

4.6.2基于条件随机场的属性及属性值的实体识别 76

4.6.3基于支持向量机的属性及属性值之间实体关系预测 77

4.7本章小结 78

第5章 基于同义词词林的大规模中文关联数据构建 80

5.1引言 80

5.2相关工作 80

5.3问题定义 82

5.4中文大规模本体映射系统 82

5.4.1基于编辑距离的初始相似度计算 82

5.4.2大规模本体压缩算法 84

5.4.3基于同义词词林的确定性映射 85

5.5本章小结 87

结论 89

1全书总结 89

2本书的主要创新点 92

3对未来工作的展望 93

参考文献 96