当前位置:首页 > 语言文字
现代汉语未登录词词类和语义类标注研究
现代汉语未登录词词类和语义类标注研究

现代汉语未登录词词类和语义类标注研究PDF电子书下载

语言文字

  • 电子书积分:9 积分如何计算积分?
  • 作 者:邱立坤著
  • 出 版 社:北京:科学出版社
  • 出版年份:2016
  • ISBN:9787030491800
  • 页数:166 页
图书介绍:未登录词处理主要包括识别、词类标注和语义类标注等内容。目前自然语言处理学界对于未登录词识别研究较多,对于未登录词词类标注和语义类标注则研究较少。因此,本文主要专注于现代汉语未登录词词类标注和语义类标注的研究。在未登录词词类标注和语义类标注过程中主要有两类可以使用的特征,即内部特征和外部特征。所谓内部特征指未登录词的成分、成分的属性以及成分、成分属性的组合序列;所谓外部特征指未登录词在语料中的分布,通常用未登录词的上下文来表示。本文在前人研究工作的基础上,构建了大规模的生语料库,分别使用基于内部特征和外部特征的方法以及两种特征相结合的方法来自动处理未登录词词类和语义类标注的问题。
《现代汉语未登录词词类和语义类标注研究》目录

第1章 绪论 1

1.1 研究对象、背景、问题及应用价值 1

1.2 研究原则、方法与技术路线 4

1.3 本书的组织结构 6

第2章 方法论 8

2.1 语言本体方面的相关研究 8

2.2 计算方面的相关研究 14

2.3 本书工作的方法论基础 18

第3章 相关资源、方法和工具 23

3.1 相关语言资源 23

3.2 条件随机场 24

3.3 评测方法与评测指标 24

3.4 软件工具 25

第4章 现代汉语复合词内部结构词典的构造 26

4.1 汉语复合词的基本构造类型 26

4.2 词典构建方案 27

4.3 自动标注方法 28

4.4 结构分析方案、原则和方法 30

4.5 结构关系类型的判断 31

4.6 成分语法类的判断 32

4.7 成分语义类的判断 34

4.8 计算机辅助人工标注 35

第5章 未登录词词类自动标注 37

5.1 基于内部特征的模型 38

5.2 可信度计算 40

5.3 基于外部特征的词类标注模型 41

5.4 实验结果 43

5.5 实验结果分析 46

第6章 基于内部特征的未登录词语义类自动标注 47

6.1 基线模型 48

6.2 基于内部特征的模型(模型1) 50

6.3 双向平行类推规则与成对替换类推规则的分析 58

6.4 实验 59

第7章 结合内部与外部特征的未登录词语义类自动标注 66

7.1 结合内部特征与外部特征的模型(模型2) 67

7.2 实验 72

第8章 未登录词语义类自动标注的应用 81

8.1 语义词典修正 81

8.2 语义词典扩充 97

第9章 基于分布式词表示的类比识别与类比挖掘 99

9.1 关系相似度任务与词嵌入模型 100

9.2 服务于类比识别的基于依存上下文的词语embedding表示 102

9.3 改进的类比识别方法:使用句法依存减少搜索空间 103

9.4 基于依存embedding的类比挖掘 104

9.5 实验 106

结语 114

参考文献 116

附录 123

附录A 双向平行类推规则示例(后字为共同成分) 123

附录B 双向平行类推规则示例(前字为共同成分) 133

附录C 成对替换类推规则示例(前字为替换成分) 134

附录D 成对替换类推规则示例(后字为替换成分) 150

后记 163

返回顶部