1 引言 1
目录 1
1.1 本体的概念 2
表目录 7
表1-1 利用中文科技期刊数据库进行本体相关研究文献的检索结果 7
1.2 本体的类型 8
图目录 8
图1-1 本体应用的3个主要领域 8
1.3 本体的作用 11
图1-2 用于交流和互操作的本体 13
1.4 本体在图书情报领域的应用 14
图1-3 基于本体的MT体系结构 18
1.5 本体在知识管理中的应用 19
图1-4 知识管理的构架 21
1.6 本书的意义、方法与创新之处 22
2 本体研究概述 26
2.1 国外主要研究现状 26
图2-1 Tim Berners-Lee的语义网结构图〔Semantic Web Architecture〕 27
表2-1 解析Tim Berners-Lee的语义网结构图 28
表2-2 语义网中的语言栈的描述 30
2.2 国内主要研究现状 36
表2-3 检索重庆维普中文科技期刊全文数据库的本体相关文献调查表 36
2.3 国内外重要的本体系统 43
图2-3 WordNet 2.0的第一步查询结果 45
图2-2 WordNet 2.0的查询界面 45
图2-4 WordNet 2.0浏览器中的名词上位概念结果反馈界面 46
表2-4 WordNet 2.0数据库单词、同义词和词义的数量 47
图2-5 OntoSeek的功能结构 52
图2-6 OntoSeek的推理结构 53
图2-7 Cyc知识库系统语义集成的数据传输总线结构 58
表2-5 知网的基本统计数据 62
2.4 本体应用领域举例 63
图2-9 分子功能本体,主要反映基因产物功能的概念分类 66
图2-8 生物学过程本体会阐示描述DNA代谢的过程 66
表2-6 GO的3个子本体从三大模式生物数据库中提取的术语(概念) 67
图2-10 细胞成分本体,表示真核生物的通用细胞模型 67
2.5 国内外研究现状的评价 73
图2-11 AOS框架 73
3 本体相关理论探讨 76
3.1 本体的体系结构和数学表达 77
表3-1 概念的基本元特性 79
3.2 本体与叙词表的联系与区别 80
表3-2 ANSI主题词表的结构 82
图3-2 花卉学本体知识分布的构想——动态的、四维网状结构 84
图3-1 构建花卉学本体的设想,学科坐标与植物分类坐标的交叉 84
图3-3 观测叙词表与本体的词表重合程度,发现知识的增长点 86
图3-5 本体中的概念间关系 87
图3-4 从文献的发表数量看学科的兴衰规律 87
图3-6 葡萄酒本体中的3个类及其属性关系的示意 88
3.3 本体与语义网络的联系与区别 90
表3-3 本体与语义网络的联系和区别 91
图3-7 语义网络示例 92
3.4 本体的标准化研究 93
表3-4 研究本体标准化的组织与项目 93
图3-8 利用Protégé-2000实现的SUMO概念树状结构 97
图3-9 开发本体生命周期中的各项工作(IEEE标准-软件开发生命周期法IEEE1074-1995[IEEE96]) 99
4 本体的主要技术方法 100
4.1 本体的主要构建方法 100
图4-1 “TOVE”流程 101
图4-2 骨架法流程 103
图4-3 SENSUS术语构造 105
表4-1 7种方法体系与IEEE标准的一致性比较 110
表4-2 7种方法体系的相互比较 111
4.2 本体表示语言 113
图4-4 RDF实例〔RDF Tutorial Pierre-Antoine Champin〕 117
表4-4 RDFS的核心属性 121
表4-5 RDFS的核心限制(Core Constraints) 121
表4-3 RDFS的核心类 121
图4-5 SHOE的本体体系 130
图4-6 OIL与RDFS的关系结构 132
表4-6 OIL中的类定义、属性定义和公理定义 135
表4-7 OWL的3个子语言描述 146
表4-8 领域知识主要元素的定义 149
表4-9 概念的定义 150
表4-10 分类体系的定义 151
表4-11 关系与函数的定义 152
表4-12 实例的定义 153
表4-13 公理的定义 154
表4-14 产生式规则的定义 155
表4-15 各种语言的推理机制 157
4.3 本体构建工具 159
图4-8 Ontolingua中未命名的本体页面 162
图4-7 Ontolingua中新建本体时的工具栏选项 162
图4-10 Ontolingua中未命名的新建类的页面 163
图4-9 Ontolingua中新建“类”时的工具栏选项 163
图4-13 未命名的新建属性的页面 164
图4-12 类“Vehicle”的页面 164
图4-11 在Ontolingua中添加新属性时的工具栏选项 164
图4-14 Ontosaurus的用户界面 166
图4-15 Ontosaurus浏览器的界面框架 167
图4-16 WebOnto的用户编辑界面 168
图4-17 Protégé-2000 v1.8的插件 170
图4-18 Protégé-2000 v2.0的插件 170
图4-19 在Protégé-2000中选择保存项目的文件格式 171
图4-20 在Protégé-2000中选择了RDF Schema作为新建项目的保存格式 171
图4-21 Flowers_0718.pprj的Class插件页面 172
图4-22 Protégé-2000中属性的编辑页面 173
图4-24 Protégé-2000中Forms插件的编辑页面 174
图4-23 Protégé-2000中实例的编辑页面 174
图4-25 Protégé-2000中Queries插件的编辑页面 175
图4-26 Protégé-2000中查询的结果显示页面 176
图4-27 OntoEdit 2.6免费测试版本用户界面 179
图4-28 在OntoEdit中用Visualizer看两个简单实例的关系 180
图4-29 OntoEdit的Visualizer界面中本体等级体系的表示 181
5 领域本体的构建——以花卉学本体模型构建为例 183
5.1 花卉学本体模型的构建方法、工具和表示语言 184
5.2 花卉学本体模型构建的必要条件 186
5.3 花卉学本体模型核心概念集的构建 187
图5-1 “花卉”的分类体系之一 198
图5-2 “花卉”的分类体系之二 199
图5-3 “花卉”的分类体系之三 200
图5-4 “花卉”的分类体系之四 200
表5-1 分析文献题名“云南省香荚兰生产的发展前景”中的术语组成表之一 205
表5-2 分析文献题名“云南省香荚兰生产的发展前景”中的术语组成表之二 205
图5-5 一个为FOS文库建立的实例体系结构,两层框架意味着复用了外来的本体 206
图5-6 Cyc顶级本体的逻辑结构 207
图5-7 概念“花卉”在Cyc顶级本体中的上位类结构 208
图5-9 其他对象对“花卉”的影响之二 211
图5-8 其他对象对“花卉”的影响之一 211
图5-11 其他对象对“花卉”的影响之三 212
图5-10 类“生物”包含“植物”,“植物”包含“花卉” 212
图5-12 其他对象对“花卉”的影响之四 213
图5-13 利用CycL表示“花卉”中的实例(将“花卉”作为物种来表示) 215
5.4 小结 227
6 基于领域本体的文献检索——花卉学文献试验性本体检索系统的构建 229
6.1 系统结构 230
图6-1 试验性系统结构示意 232
图6-2 FORS系统用户查询界面之关键词查询 238
图6-4 FORS系统用户查询界面之CycL提问 239
图6-3 FORS系统用户查询界面之概念查询 239
图6-5 FORS系统微理论(领域)录入页面 240
图6-6 在FORS系统的微理论“花卉学”之下添加子微理论 241
图6-7 在FORS系统中创建Cyc常量的页面 241
图6-8 在FORS系统知识录入界面中添加概念同义词 242
图6-10 在FORS系统知识录入界面中添加断言(公理) 243
图6-9 FORS系统中某一被添加的概念会涉及到花卉学本体模型中的其他概念 243
图6-12 在FORS系统知识录入界面里添加“概念关系” 244
图6-11 FORS系统中与所选断言类似断言的列表 244
图6-13 FORS系统数据结构E-R图 248
图6-14 FORS系统中的Cyc常量列表(KNOWLEDGE-CONSTANT表) 249
6.2 系统的文献数据标引 249
图6-15 FORS系统中的同义词列表(KNOWLEDGE-VOCABULARY表) 250
6.3 概念的一致性检查与纠错 251
6.4 系统功能验证 254
图6-16 试验性系统中求所有解算法示意 255
图6-17 FORS“在北京居家可以栽培郁金香吗?”输入页面和答案返回页面 258
图6-18 FORS系统的查询流程 259
图6-19 “为害桂花的物种”文献查询页面 261
图6-20 “为害桂花物种”的查询结果显示页面 262
表6-2 利用FORS系统查询“梅花”相关文献的结果 264
表6-1 利用NSTL文献查询系统以“梅花”为关键词的检索结果 264
6.5 系统应用前景 267
表6-3 利用NSTL文献查询系统以“牡丹”为关键词的检索结果 267
图6-21 未来语义网框架示意 268
7.1 本书的内容和结论 269
7 总结与讨论 269
7.2 研究中存在的问题 271
7.3 后续研究 273
参考文献 275
附录1 本书所用英文缩略术语表 290
附录2 AIFB研究所的知识本体相关研究项目一览表 296
附录3 主要本体表示语言一览表 304
附录4 本体编辑工具一览表 312