《面向英语书面语误自动检测的依存规则研究》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:刘磊著
  • 出 版 社:北京:外语教学与研究出版社
  • 出版年份:2016
  • ISBN:9787513579162
  • 页数:219 页
图书介绍:《面向英语书面语误自动检测的依存规则研究》结合基于语法规则和基于统计两种语法检测方法的优点,使用混合法进行自动语法检查:混合法以语法规则为基础编写错误模板,同时,从大规模经过词性和句法标注的语料库中提取词汇-语法信息构建模型,弥补模板的不足,提高现有语法检测系统的准确率。

绪论 1

0.1 研究背景 1

0.2 研究意义 2

0.3 研究概述 3

0.3.1 研究目的 3

0.3.2 研究问题 3

0.3.3 研究步骤 3

0.3.4 关键术语 4

0.4 论文结构 7

第一章 自动语法检查的基本原理及相关研究 8

1.1 人工编写规则的自动语法检查 9

1.1.1 基本原理 9

1.1.1.1 基于PSG的句法分析 9

1.1.1.2 基于特征结构的句法分析 12

1.1.1.3 基于词汇的句法分析 14

1.1.2 相关研究 15

1.1.2.1 基于APSG的自动语法检查 15

1.1.2.2 基于HPSG的自动语法检查 16

1.1.2.3 基于链语法的自动语法检查 16

1.2 数据驱动的自动语法检查 17

1.2.1 基本原理 18

1.2.1.1 N元语法模型 18

1.2.1.2 自动分类模型 18

1.2.1.3 句法分析模型 19

1.2.2 相关研究 23

1.2.2.1 基于N元语法模型的自动语法检查 23

1.2.2.2 基于自动分类模型的自动语法检查 24

1.2.2.3 基于句法分析模型的自动语法检查 25

1.3 小结 26

1.3.1 文献评价 26

1.3.2 研究设想 27

第二章 依存语法 29

2.1 理论语言学视角下的依存语法 30

2.1.1 关联理论 30

2.1.2 功能生成语法理论 31

2.1.3 意义-文本理论 32

2.1.4 词语法理论 33

2.2 计算语言学视角下的依存语法 33

2.2.1 依存语法的形式化 34

2.2.2 依存关系的自动分析 36

2.2.2.1 基于CKY算法的句法分析 38

2.2.2.2 基于移进-规约算法的句法分析 39

2.2.2.3 基于自顶向下算法的句法分析 40

2.2.2.4 依存关系自动分析算法对比 41

2.3 依存树库 43

2.3.1 依存树库的标注体系和方法 43

2.3.2 依存树库的存储和检索 46

2.4 小结 48

2.4.1 文献评价 48

2.4.2 研究设想 48

第三章 链语法 50

3.1 链语法词典 50

3.1.1 词条 50

3.1.2 链接子表达式 51

3.1.2.1 链接子 52

3.1.2.2 逻辑操作符 53

3.1.2.3 宏 54

3.2 链语法算法 54

3.2.1 链接子匹配 55

3.2.2 空链接机制 56

3.2.3 后处理机制 57

3.2.4 排序机制 59

3.3 小结 60

3.3.1 文献评价 60

3.3.2 研究设想 61

第四章 研究方法 62

4.1 具体研究步骤 62

4.2 研究工具 64

4.2.1 树库转换工具 64

4.2.2 树库检索工具 67

4.2.3 自编程序 69

4.3 训练语料及其格式转换 77

4.3.1 原始训练语料 77

4.3.1.1 PTB短语结构树库的标注方法 78

4.3.1.2 PTB短语结构树库的标注体系 78

4.3.1.3 PTB短语结构树库的存储 83

4.3.2 训练语料格式的转换 83

4.3.3 转换后的训练语料 85

4.3.3.1 PTB依存树库的标注体系 85

4.3.3.2 PTB依存树库的存储 87

4.3.3.3 PTB依存树库的统计信息 90

4.3.3.4 依存关系的修改 90

4.4 测试语料及其预处理 94

4.4.1 测试语料的抽样 94

4.4.2 测试语料的预处理 95

4.5 小结 96

第五章 依存关系的修改 98

5.1 修改依存关系的理论基础 98

5.1.1 “助动词+动词”结构 99

5.1.2 “介词+名词”结构 100

5.1.3 动词不定式结构 101

5.1.4 疑问句和定语从句结构 102

5.1.5 并列结构 103

5.2 调整依存关系的中心词 104

5.2.1 punct类依存关系 105

5.2.2 mwe类依存关系 106

5.2.3 cop类依存关系 107

5.2.4 aux类依存关系 109

5.3 细化依存关系的类别 110

5.3.1 advcl类依存关系 111

5.3.2 ccomp类依存关系 112

5.3.3 xcomp类依存关系 116

5.3.4 aux类依存关系 119

5.3.5 nsubj类依存关系 120

5.3.6 det类依存关系 125

5.3.7 prep类依存关系 127

5.3.8 advmod类依存关系 128

5.3.9 cc&conj类依存关系 129

5.3.10 rcmod类依存关系 130

5.4 dep类依存关系和错误标注 132

5.4.1 dep类依存关系 132

5.4.2 错误标注 133

5.5 小结 134

第六章 链语法词典的构建和测试 136

6.1 链语法词典的构建 136

6.1.1 链语法词典的提取和合并 136

6.1.2 稀疏数据的处理 138

6.1.2.1 产生稀疏数据的原因 139

6.1.2.2 解决稀疏数据的方法 140

6.1.3 新建链语法词典与原词典的区别 152

6.2 新建链语法词典的测试 153

6.2.1 测试工具 153

6.2.2 测试方法 155

6.2.2.1 准确率、召回率和F值的计算 155

6.2.2.2 后处理 155

6.2.3 测试结果 156

6.2.3.1 新建词典和原词典的评测结果对比 156

6.2.3.2 新建词典的漏判与误判分析 159

6.3 小结 160

第七章 结论 162

7.1 主要贡献 162

7.2 研究的不足和后续研究计划 165

参考文献 168

附录 183