《基于HNC的现代汉语句子级语义标注语料库的研究和建立》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:刘智颖著
  • 出 版 社:北京:中国社会科学出版社
  • 出版年份:2015
  • ISBN:9787516155769
  • 页数:182 页
图书介绍:本书针对自然语言处理资源建设方面的需求,从语义的角度、句子的层面研究建立句子级语义标注语料库。以HNC(概念层次网络)理论句类体系为基础,探讨了句子级语义标注语料库的标注内容、标注方法和标注难点,确定了XML的标注规范,设计了语料库的查询工具。本书是HNC理论在资源建设方面的研究与发展。该语料库的建设与研究不仅对于计算机理解语义具有重要意义,而且对语言学工作者也具有一定的参考价值。

第一章 绪论 1

第一节 中文信息处理的研究热点 1

第二节 基于HNC的现代汉语句子级语义标注语料库 2

第三节 本书的研究内容 4

一 标注项 4

二 标注方式 6

三 管理工具功能设计 7

第四节 已有的研究 7

一 现代汉语词义标注语料库 9

二 汉语框架语义标注语料库 9

三 语义结构标注语料库 10

第五节 本书的结构安排 10

第二章 HNC理论及其句类思想 12

第一节 HNC理论简介 12

第二节 HNC的句类思想 13

第三节 句类及句类知识 14

一 基本句类 15

二 混合句类 16

三 复合句类 18

第三章 HNC语义标注语料库的设计 19

第一节 语料的采集 20

第二节 语料的加工 22

一 标注规模 22

二 标注特点 23

三 标注形式 25

第四章 HNC语义标注语料库的标注规范 27

第一节 XML语言介绍 27

一 XML的历史 27

二 XML的内容 29

三 XML的特点和优点 30

第二节 HNC语义标注语料库的XML标注规范 34

一 XML文档 34

二 Schema模式 40

三 XSL转换 46

第五章 HNC语义标注语料库的标注 56

第一节 标注内容 56

一 篇头信息 56

二 篇体信息 57

第二节 标注难点 87

一 语义块核心要素的部分缺省 88

二 包装品与分离语 92

三 “的”字短语 99

四 “所”字结构 104

五 基于全句理解的句类 109

第六章 语料标注工具的设计与使用 116

第一节 TXT-XML文档的转换 116

第二节 XMLSpy标注工具的使用 119

一 XMLSpy工具介绍 119

二 语料的标注 119

三 检查与验证 126

第七章 HNC语义标注语料库查询工具 129

第一节 查询工具的特点 129

一 快捷的查询速度 130

二 友好的查询界面 131

三 强大的查询功能 132

第二节 查询工具的功能设计 132

一 数据的存储 132

二 数据库的操作 132

三 语料查询 134

第八章 HNC语义标注语料库的应用 147

第一节 在语言本体研究方面的应用 148

第二节 在中文信息处理方面的应用 149

第三节 在语言教学方面的应用 151

第四节 结语 153

附录 154

附录1 HNC句子级语义标注语料库的XML规范 154

附录2 HNC句子级语义标注语料库标注文档示例 165

参考文献 173

后记 181