当前位置:首页 > 语言文字
多语言领域本体学习研究
多语言领域本体学习研究

多语言领域本体学习研究PDF电子书下载

语言文字

  • 电子书积分:10 积分如何计算积分?
  • 作 者:章成志编
  • 出 版 社:南京:南京大学出版社
  • 出版年份:2012
  • ISBN:9787305106705
  • 页数:206 页
图书介绍:本书主要研究了构建专业领域本体的理论与方法,主要研究对象是自然语言,理论基础为知识本体。本书是关于语言本体研究的学术著作,综合了多语言领域本题学习研究的多种方法,包括双语核心术语抽取、一体化术语抽取、术语对齐、概念层次体系生成、主题层次体系生成等方法。本书所述内容对网络、图书、资料库等媒体中的语言信息分析研究提供了多种有效的技术方法,可供相关研究人员学习交流研究之用。
《多语言领域本体学习研究》目录

第1章 引言 1

1.1 研究背景 1

1.2 研究内容概况 4

1.2.1 课题概述 4

1.2.2 多语言本体学习框架与开发平台的设计 4

1.3 本书的内容与章节安排 6

参考文献 6

第2章 多语言领域本体学习研究综述 9

2.1 多语言词汇资源概述 9

2.2 多语言本体学习研究现状 12

2.2.1 本体学习综述 12

2.2.2 典型的本体学习工具概述 18

2.2.3 多语本体构建相关研究概述 21

2.3 多语言本体应用项目概述 27

2.3.1 基本原理 28

2.3.2 相关应用项目概述 30

2.4 本章小结 38

参考文献 38

第3章 基于领域平行语料的双语核心术语抽取研究 45

3.1 相关研究概述 45

3.2 基于专业领域平行语料的双语核心术语抽取 46

3.2.1 总体流程与关键技术 46

3.2.2 抽取结果与分析 49

3.2.3 模块运行界面 53

3.3 基于领域分类知识库的术语分类 55

3.3.1 术语分类概述 55

3.3.2 基于领域分类知识库的术语分类 57

3.4 本章小结 59

参考文献 59

第4章 基于多层术语度的一体化术语抽取研究 63

4.1 相关研究概述 63

4.2 基于多层术语度的一体化术语抽取 66

4.2.1 一体化术语抽取策略 66

4.2.2 条件随机场模型概述 68

4.2.3 多层术语度特征度量 68

4.2.4 术语抽取结果与分析 73

4.2.5 模块运行界面 77

4.3 本章小结 81

参考文献 81

第5章 基于术语度约束的双语术语对齐研究 85

5.1 相关研究概述 85

5.2 基于术语度约束的双语术语对齐 91

5.2.1 基本原理 91

5.2.2 基于术语度约束的词对齐结果优化 92

5.2.3 基于术语度约束的双语术语对齐 95

5.2.4 模块运行界面 102

5.3 本章小结 105

参考文献 106

第6章 基于多语术语聚类的概念层次体系生成研究 109

6.1 相关研究概述 109

6.2 基于多语术语聚类的概念层次体系生成 112

6.2.1 总体流程与关键技术 112

6.2.2 实验结果与分析 120

6.2.3 模块运行界面 125

6.3 本章小结 131

参考文献 132

第7章 基于多语文本聚类的主题层次体系生成研究 135

7.1 相关研究概述 135

7.2 基于多语言文本聚类的主题式概念层次生成 141

7.2.1 主题式概念层次生成基本原理 141

7.2.2 基于多语言文本聚类的主题式层次体系生成策略 142

7.2.3 实验结果与分析 143

7.2.4 模块运行界面 149

7.3 本章小结 152

参考文献 152

第8章 结束语 156

8.1 总结 156

8.2 进一步工作 156

8.2.1 双语术语抽取方面 156

8.2.2 多语言层次关系生成方面 160

8.2.3 概念间其他关系的发现 160

附录 161

附录1 Segtag汉语文本词性标注标记集 161

附录2 Penn Treebank词性标注标记集 163

附录3 核心术语训练阶段类间分布熵计算结果样例 164

附录4 候选核心术语抽取样例(法律类Top-40) 169

附录5 双语候选核心术语对齐样例(法律类Top-40) 170

附录6 《人民日报》(1998年上半年)语料词频排序(Top-40) 171

附录7 NTCIR新闻语料词频排序(Top-40) 172

附录8 新闻语句样例中的术语度 173

附录9 专业领域语句样例中的术语度 174

附录10 术语抽取模型训练标注语料片段 175

附录11 用于术语抽取的CRF++特征模板 176

附录12 术语抽取10折交叉验证结果 177

附录13 Giza++结果中术语度比值排序(Top-40) 180

附录14 IT领域1万句对的双语术语抽取结果(Top-40) 181

附录15 基于术语聚类的多语言概念层次体系示例 186

附录16 基于文本聚类的主题层次体系示例 192

附录17 语料库与开源工具列表 197

后记 199

索引 201

返回顶部