第1章 绪论 1
1.1 研究对象、背景、问题及应用价值 1
1.2 研究原则、方法与技术路线 4
1.3 本书的组织结构 6
第2章 方法论 8
2.1 语言本体方面的相关研究 8
2.2 计算方面的相关研究 14
2.3 本书工作的方法论基础 18
第3章 相关资源、方法和工具 23
3.1 相关语言资源 23
3.2 条件随机场 24
3.3 评测方法与评测指标 24
3.4 软件工具 25
第4章 现代汉语复合词内部结构词典的构造 26
4.1 汉语复合词的基本构造类型 26
4.2 词典构建方案 27
4.3 自动标注方法 28
4.4 结构分析方案、原则和方法 30
4.5 结构关系类型的判断 31
4.6 成分语法类的判断 32
4.7 成分语义类的判断 34
4.8 计算机辅助人工标注 35
第5章 未登录词词类自动标注 37
5.1 基于内部特征的模型 38
5.2 可信度计算 40
5.3 基于外部特征的词类标注模型 41
5.4 实验结果 43
5.5 实验结果分析 46
第6章 基于内部特征的未登录词语义类自动标注 47
6.1 基线模型 48
6.2 基于内部特征的模型(模型1) 50
6.3 双向平行类推规则与成对替换类推规则的分析 58
6.4 实验 59
第7章 结合内部与外部特征的未登录词语义类自动标注 66
7.1 结合内部特征与外部特征的模型(模型2) 67
7.2 实验 72
第8章 未登录词语义类自动标注的应用 81
8.1 语义词典修正 81
8.2 语义词典扩充 97
第9章 基于分布式词表示的类比识别与类比挖掘 99
9.1 关系相似度任务与词嵌入模型 100
9.2 服务于类比识别的基于依存上下文的词语embedding表示 102
9.3 改进的类比识别方法:使用句法依存减少搜索空间 103
9.4 基于依存embedding的类比挖掘 104
9.5 实验 106
结语 114
参考文献 116
附录 123
附录A 双向平行类推规则示例(后字为共同成分) 123
附录B 双向平行类推规则示例(前字为共同成分) 133
附录C 成对替换类推规则示例(前字为替换成分) 134
附录D 成对替换类推规则示例(后字为替换成分) 150
后记 163