第1章 导论 1
1.1语义技术概述 2
1.2海量语义数据处理 4
1.3 LarKC概述 5
1.3.1 LarKC项目 5
1.3.2 LarKC技术概述 8
1.3.3 LarKC海量语义数据处理平台概述 10
1.3.4 LarKC应用技术开发概述 11
1.4本章小结 12
参考文献 12
第一部分 技术篇 17
第2章LarKC海量语义数据处理平台 17
2.1 LarKC体系结构 17
2.2 LarKC平台的安装与使用 19
2.2.1获取LarKC 19
2.2.2运行LarKC 20
2.2.3一个简单工作流实例 20
2.3工作流设计器 22
2.3.1工作流设计器概览 22
2.3.2安装及主要操作 23
2.4 LarKC插件概述 24
2.5用户支持和版权信息 26
2.6本章小结 27
参考文献 27
第3章 识别与选择 29
3.1识别方法与识别插件 29
3.2基于兴趣的选择方法与插件实现 31
3.2.1基本原理与基本算法 31
3.2.2方法的可扩展性与效率比较 34
3.2.3基于兴趣的选择插件设计与实现 37
3.3随机索引选择方法与插件实现 40
3.3.1语义索引 40
3.3.2基于随机索引与Lucene索引的检索比较 43
3.4选择方法与选择插件的应用 47
3.4.1基于兴趣的选择插件应用示例 48
3.4.2随机索引选择插件应用示例 51
3.5本章小结 53
附录第3.3.2节相关询问 53
参考文献 57
第4章 抽象与转换 59
4.1机器学习 59
4.1.1 SUNS 60
4.1.2机器学习插件 63
4.2数据流 66
4.2.1 C-SPARQL 67
4.2.2数据流插件 73
4.3归纳与演绎结合的数据流推理 77
4.3.1动机 77
4.3.2数据流推理的结构框架 78
4.4本章小结 79
参考文献 79
第5章 推理与决策 82
5.1 LarKC推理与决策插件 83
5.2常规语义推理 86
5.2.1 OWLAPI推理机 86
5.2.2 SPARQL DL推理机 88
5.3并行与分布式推理 92
5.3.1采用MapReduce技术的海量分布性推理 92
5.3.2采用WebPIE进行OWL分布性推理 96
5.4基于规则的推理 98
5.5本章小结 100
参考文献 101
第6章 非常规语义推理 102
6.1不一致本体的推理 102
6.1.1语义网与不一致性 102
6.1.2基本方法 104
6.1.3 LarKC平台下的PION系统 108
6.2转折推理 111
6.2.1基本定义 111
6.2.2计算方法和实现 112
6.2.3转折推理插件 113
6.3嘈杂语义数据的推理 116
6.3.1基本定义 116
6.3.2韩国首尔RSM系统示例 117
6.4本章小结 122
参考文献 123
第7章LarKC系统与应用开发 124
7.1 LarKC工作流开发 124
7.1.1工作流图 124
7.1.2工作流描述 125
7.1.3更复杂的一个示例 127
7.2 LarKC插件开发 130
7.2.1 LarKC Maven原型的使用 130
7.2.2插件代码编写 135
7.2.3整合插件到LarKC平台 138
7.3相关的开发工具 140
7.3.1集成开发环境Eclipse 140
7.3.2项目管理Maven 140
7.3.3单元测试JUnit 141
7.3.4版本控制SVN 141
7.4本章小结 142
附录 复杂的工作流描述示例 142
参考文献 144
第二部分 应 用篇 147
第8章 关联生命数据集 147
8.1概况 147
8.2关联生命数据组成 147
8.3语义关联构造 150
8.4关联生命数据集的使用 152
8.4.1关联生命数据集关键词查询 153
8.4.2关联生命数据集SPARQL语义查询 155
8.5本章小结 164
参考文献 164
第9章 生物医学文献语义检索 166
9.1需求分析 166
9.2通过LLD进行医学文献检索 169
9.3医学文献语义标注 178
9.4 LarKC医学文献语义检索插件 180
9.5本章小结 181
参考文献 182
第10章 海量语义数据处理与基因研究 183
10.1概述 183
10.2基因研究与语义数据 184
10.3 LarKC海量语义数据处理平台用于GWAS研究 189
10.3.1 LarKC的GWAS插件 189
10.3.2关键词扩展推理器 189
10.3.3 GWAS识别器 197
10.3.4 GWAS工作流 199
10.4本章小结 204
参考文献 205
第11章 城市计算Ⅰ:交通与社交媒体 207
11.1交通路线规划 207
11.1.1框架结构 208
11.1.2交通预测 209
11.1.3语义交通路线规划 211
11.1.4评价 213
11.1.5小结 215
11.2社交媒体分析 216
11.2.1概况 216
11.2.2框架结构 218
11.2.3 BOTTARI的LarKC工作流 220
11.3本章小结 229
参考文献 229
第12章 城市计算Ⅱ:路标管理 231
12.1基本思想 231
12.2 RSM数据集与数据整合 234
12.2.1 RSM数据集 234
12.2.2数据整合 236
12.2.3路标的有效性审核 238
12.3 RSM语义数据处理 239
12.3.1系统结构 239
12.3.2 RSM工作流 240
12.3.3 RSM查询与推理 241
12.4 RSM系统用户界面 243
12.5本章小结 246
参考文献 246
第13章 海量语义数据处理技术展望 248
13.1市场分析 248
13.1.1语义技术的市场观察和潜力 248
13.1.2市场分析的结论 249
13.2 LarKC海量语义数据平台应用展望 250
13.2.1药物研发海量语义数据处理 250
13.2.2语义技术用于政治文化分析 251
13.2.3智能交通系统 251
13.2.4基于语义技术的电子病历 252
13.3海量语义数据处理研究展望 253
13.4结束语 255
参考文献 255