第一章 绪论 1
1.1 语义网及其面临的挑战 2
1.2 与Web 1.0和Web 2.0的区别 5
1.3 语义网体系结构 7
1.4 语义网规范 10
1.4.1 资源描述框架 10
1.4.2 RDFS/OWL 12
1.4.3 SPARQL 17
1.4.4 GRDDL 19
1.4.5 RDFa 21
1.5 本章小结 23
参考文献 23
第二章 语义数据模型 25
2.1 数据模型简介 25
2.1.1 语义及数据模型 26
2.1.2 语义数据模型特征 27
2.1.3 语义数据模型分类 28
2.2 逻辑及物理数据模型 29
2.2.1 层次和网状数据模型 29
2.2.2 关系数据模型 30
2.2.3 面向对象的数据模型 31
2.2.4 模糊语义模型 33
2.2.5 图模型 35
2.3 概念数据模型 35
2.3.1 实体-关系模型 35
2.3.2 RM/T 36
2.3.3 SDM 37
2.3.4 资源空间模型及语义链网络 39
2.4 主动语义数据模型 40
2.4.1 主动语义数据模型概述 40
2.4.2 事件模型研究现状 43
2.4.3 FEM 46
2.4.4 事件探测 58
2.5 本章小结 71
参考文献 72
第三章 语义数据抽取 75
3.1 信息抽取技术简介 75
3.1.1 国内外研究现状 75
3.1.2 信息抽取技术分类 78
3.2 科技文献元数据抽取 84
3.2.1 科技文献特征 85
3.2.2 信息抽取预处理 88
3.2.3 基于模板匹配的头部信息抽取 93
3.2.4 基于统计的尾部信息抽取 98
3.2.5 信息封装 104
3.3 科技文献信息抽取系统及其性能评价 105
3.3.1 科技文献信息抽取系统 105
3.3.2 评价指标 107
3.3.3 实验结果及分析 109
3.4 语义数据清理 114
3.4.1 语义数据清理概述 114
3.4.2 歧义实体的识别 115
3.4.3 重复数据的发现 119
3.5 本章小结 126
参考文献 126
第四章 数据分类 131
4.1 数据分类意义 131
4.2 研究现状 132
4.2.1 传统文本分类 133
4.2.2 层次分类 134
4.2.3 基于知识的分类 135
4.3 多类别文本自动分类方法 136
4.3.1 支持向量机分类方法 136
4.3.2 k近邻分类方法 138
4.3.3 多类别单标签分类方法MSVM-kNN 139
4.3.4 多类别多标签分类方法 143
4.4 多类别文本分类实现技术 146
4.4.1 文献预处理 147
4.4.2 特征降维 147
4.4.3 权重计算 148
4.4.4 分类器设计 151
4.5 多类别分类方法性能评价 153
4.6 本章小结 157
参考文献 157
第五章 语义网数据存储技术 162
5.1 语义网数据存储技术现状 162
5.1.1 RDF数据模型 162
5.1.2 RDF存储结构 164
5.1.3 RDF查询语言 165
5.1.4 语义数据索引技术 168
5.1.5 语义网数据存储系统 171
5.2 语义网数据管理系统DBLink 174
5.2.1 DBLink的体系结构 175
5.2.2 基于主存的面向对象存储模型 178
5.2.3 URI映射与内置数据类型 179
5.2.4 语义网数据分割与映射 180
5.2.5 语义网数据的压缩存储 182
5.2.6 模式空间与实例空间分离 183
5.3 DBLink性能评价 187
5.3.1 测试数据集 187
5.3.2 实验环境 189
5.3.3 测试查询集 189
5.3.4 实验结果 191
5.4 本章小结 193
参考文献 194
第六章 语义数据检索技术 197
6.1 语义数据检索的分类 197
6.1.1 传统数据/信息检索 198
6.1.2 语义网数据检索 200
6.1.3 语义网格/知识网格中的数据检索 201
6.1.4 对等网络中的信息检索 202
6.2 语义关联数据模型及其检索的关键问题 203
6.2.1 支持知识评价的语义关联数据模型 203
6.2.2 实用且有效的语义数据检索机制 203
6.2.3 模糊语义数据的表达及检索 203
6.2.4 基于语义的对等网数据组织及其检索 204
6.3 支持知识评价的语义关联数据模型 204
6.3.1 语义关联数据模型 206
6.3.2 数据的检索及回答 210
6.4 基于关键字的语义数据检索 213
6.4.1 问题描述 215
6.4.2 近似搜索算法及分析 217
6.4.3 相关问题讨论 221
6.5 基于语义模糊性和用户偏好的检索机制 221
6.5.1 后台知识库的语义模糊性 224
6.5.2 用户检索请求的规范化 229
6.5.3 检索结果的排序 231
6.6 基于语义小世界的数据检索 233
6.6.1 语义小世界的构建 234
6.6.2 数据检索算法 237
6.7 本章小结 238
参考文献 239
第七章 语义数据检索可视化 246
7.1 信息检索可视化 246
7.2 研究现状 247
7.2.1 可视化技术概述 247
7.2.2 基于分类的文档簇法 248
7.2.3 基于超链接法 249
7.2.4 基于文档内容的信息可视化方法 249
7.2.5 网络知识发现的可视化方法 250
7.2.6 分类信息检索可视化方法 251
7.2.7 其他信息可视化系统 252
7.3 基于关联的语义网情景检索 253
7.3.1 基本概念 254
7.3.2 情景值计算 255
7.3.3 情景可视化 256
7.3.4 实体推荐 257
7.4 语义网情景检索的实现 258
7.4.1 关联信息可视化体系结构 259
7.4.2 关联信息双缓存 262
7.4.3 关联信息可视化策略 264
7.5 本章小结 271
参考文献 271
第八章 语义网数据应用系统 273
8.1 CiteSeer 273
8.1.1 CiteSeer的设计理念和功能 273
8.1.2 软件系统分析 275
8.1.3 自动引用索引 277
8.1.4 论文相似度计算方法 278
8.1.5 CiteSeerX 279
8.1.6 CiteSeer的意义 281
8.2 Google Scholar 282
8.2.1 系统功能和服务 283
8.2.2 特征分析 283
8.2.3 对数字图书馆的影响 287
8.3 Libra 287
8.3.1 Libra应用状况 288
8.3.2 对象级检索 289
8.4 Bibster 292
8.4.1 Bibster的特点 292
8.4.2 Bibster的软件结构 293
8.4.3 Bibster中的本体 294
8.5 Scirus 296
8.6 基于语义关联的科研文献共享系统SemreX 298
8.6.1 SemreX的软件结构 298
8.6.2 文献共享系统的比较 301
8.7 语义网数据应用现状与趋势 303
参考文献 304