当前位置:首页 > 语言文字
基于修辞结构树库的篇章衔接标记研究
基于修辞结构树库的篇章衔接标记研究

基于修辞结构树库的篇章衔接标记研究PDF电子书下载

语言文字

  • 电子书积分:10 积分如何计算积分?
  • 作 者:乐明著
  • 出 版 社:北京/西安:世界图书出版公司
  • 出版年份:2019
  • ISBN:9787519258788
  • 页数:237 页
图书介绍:本文定量考察汉语常见篇章衔接标记在书面话语中的连贯用法。首先根据修辞结构理论(Rhetorical Structure Theory,RST),设立了汉语修辞关系集以及关系优选协议,按标注流程开发出汉语财经评论修辞结构树库。接着为各类衔接标记在该篇章语料库中的分布和用法设立多个特征变量,展开形式、句法、语义和语用标注。随后利用树库和标注语料,对特定衔接标记展开深入的个案分析,探讨其篇章分布与语用连贯作用之间的相关性。最后尝试利用衔接标记及其所在篇章单元的形式特征,通过机器学习方法来自动判定所在篇章单元间的修辞连贯关系,测试结果较令人满意。本文最后也讨论了对人工标注质量的理解,以及数据挖掘技术在语言学研究中的应用前景。
《基于修辞结构树库的篇章衔接标记研究》目录

缩略语 1

第一章 篇章连贯研究概论 3

1.1 研究对象 4

1.2 研究背景 7

1.2.1 篇章连贯的理论研究 8

1.2.2 篇章剖析技术的发展 10

1.2.3 标注篇章语料库的开发 12

1.2.4 中文信息处理的相关研究 14

1.3 研究问题 16

1.4 研究方法及主要成果 16

1.5 本书结构 17

第二章 研究方法 19

2.1 语料库设计 20

2.2 语料标注 21

2.2.1 标注理据 21

2.2.2 标注原则 22

2.2.3 标注格式 23

2.2.4 标注手段 23

2.2.5 标注质量的控制和检验 24

2.3 统计分析和机器学习 26

2.3.1 描述性统计 26

2.3.2 推断性统计 27

2.3.3 机器学习 28

2.4 小结 31

第三章 构建汉语篇章修辞结构树库 32

3.1 修辞结构理论 32

3.1.1 内容简介 33

3.1.2 应用情况 36

3.1.3 主要争议 36

3.1.4 与汉语传统理论的比较 39

3.2 构建汉语篇章语料库 41

3.2.1 语料选择 41

3.2.2 语料预处理 42

3.3 汉语篇章基本单元切分 43

3.3.1 篇章基本单元的定义 43

3.3.2 切分的方法 45

3.3.3 自动切分的形式标记 46

3.3.4 自动切分的处理结果 47

3.4 汉语篇章修辞关系集的设定 48

3.4.1 基于特征的定义方法 49

3.4.2 汉语修辞关系集的简化分类 52

3.4.3 一些说明 57

3.5 修辞关系标注及篇章修辞结构树的构造 58

3.5.1 分号句层级及以上的修辞结构标注 59

3.5.2 逗号子句层级的修辞结构标注 63

3.6 工具和流程 68

3.7 质量控制和检验 70

3.8 小结 72

第四章 标注篇章衔接标记特征 74

4.1 标注对象 75

4.2 理论框架 76

4.2.1 连接词 77

4.2.2 指代词 78

4.2.3 语气词 80

4.2.4 标点符号 81

4.3 自动标注 81

4.4 人工标注 82

4.4.1 标注内容(通用部分) 83

4.4.2 软件工具 84

4.4.3 标注流程和质量控制 85

4.5 统计分析和参数选择 87

4.6 小结 88

第五章 数据分析 89

5.1 财经评论语料库篇章结构特点 89

5.1.1 修辞结构树特征 89

5.1.2 分号句层级上的RR概率分布 90

5.1.3 小结 93

5.2 但、但是 93

5.2.1 前人成果 93

5.2.2 标注方案 95

5.2.3 数据结果 96

5.2.4 讨论 100

5.2.5 小结 103

5.3 这、那 103

5.3.1 前人成果 104

5.3.2 标注方案 104

5.3.3 数据结果 105

5.3.4 讨论 107

5.3.5 小结 111

5.4 吗、? 112

5.4.1 前人成果 112

5.4.2 标注方案 113

5.4.3 数据结果 114

5.4.4 讨论 118

5.4.5 小结 122

第六章 应用测试―以“因为”为例 123

6.1 研究背景 123

6.2 任务分析 125

6.3 学习工具 127

6.4 数据处理、结果及讨论 128

6.5 小结 130

第七章 讨论 132

7.1 修辞结构树的理论和工程价值 132

7.1.1 修辞结构树和修辞关系的性质 132

7.1.2 修辞结构的层级同质性 134

7.1.3 修辞结构树与依存句法树 136

7.2 对RR与DCM的理解 138

7.2.1 RR的多义性和模糊性 138

7.2.2 DCM的变异和多义性 141

7.2.3 RR与DCM间的多对多映射 142

7.2.4 多义性、多因分析与多任务学习 143

7.3 对语料库人工标注的理解 144

7.3.1 人工标注的准确性和挑战 144

7.3.2 一致性指标的解读 146

7.3.3 可能的解决方案 148

7.4 数据挖掘技术在语言工程和理论研究的应用 149

第八章 结 语 153

第九章 附 录 156

9.1 中文RR关系集(按中文名称排序) 156

9.2 中文RR定义及示例(按英文名称排序) 157

9.2.1 addition-n(附加一n) 158

9.2.2 addition-s(附加一s) 159

9.2.3 antithesis-s(转折一s) 160

9.2.4 attribution-m(引述一m) 161

9.2.5 attribution-s(引述一s) 163

9.2.6 background-s(背景一s) 164

9.2.7 circumstance-s(环境一s) 165

9.2.8 concession-n(让步一n) 166

9.2.9 concession-s(让步一s) 167

9.2.10 condition-s(条件一s) 168

9.2.11 conjunction-m(并列一m) 169

9.2.12 contrast-m(对立一m) 169

9.2.13 disjunction-m(析取一m) 171

9.2.14 elaboration-s(详述一s) 172

9.2.15 enablement-s(使能一s) 173

9.2.16 evaluation-m(评价一m) 173

9.2.17 evaluation-n(评价一n) 174

9.2.18 evaluation-s(评价一s) 176

9.2.19 evidence-s(证据一s) 176

9.2.20 interpretation-n(解释一n) 177

9.2.21 interpretation-s(解释一s) 178

9.2.22 joint-m(联接一m) 179

9.2.23 justify-n(论证一n) 181

9.2.24 justify-s(论证一s) 183

9.2.25 list-m(罗列一m) 183

9.2.26 means-s(方式一s) 184

9.2.27 motivation-s(动机一s) 184

9.2.28 nonvolitional-cause-s(非意愿性原因一s,NVC) 184

9.2.29 nonvolitional-cause-result-m(非意愿性因果一m,NCR) 185

9.2.30 nonvolitional-result-s(非意愿性结果一s,NVR) 186

9.2.31 otherwise-s(否则一s) 187

9.2.32 preparation-s(准备一s) 188

9.2.33 purpose-S(目的一s) 190

9.2.34 question-m(问答一m) 191

9.2.35 question-s(问答一s) 191

9.2.36 restatement-s(重述一s) 192

9.2.37 same-unit-m(同一单元一m) 193

9.2.38 sequence-m1(主观语用序列一m) 194

9.2.39 sequence-m2(客观语义序列一m) 195

9.2.40 solution-m(解答一m) 196

9.2.41 solution-n(解答一n) 197

9.2.42 solution-s(解答一s) 198

9.2.43 summary-s(总结一s) 199

9.2.44 topic-comment-m(话题一评论一m) 200

9.2.45 unconditional-s(无条件一s) 201

9.2.46 unless-s(除非一s) 201

9.2.47 volitional-casue-s(意愿性原因一s,VC) 202

9.2.48 volitional-cause-result-m(意愿性因果一m,VCR) 203

9.2.49 volitional-result-s(意愿性结果一s,VR) 204

9.2.50 ???一s(未知关系) 205

9.3 汉语RR标注关系优选协议及相关说明(2.0) 205

9.4 CRST-DT树形构造规范(2017.6) 210

9.4.1 树形选择 210

9.4.2 N的确定 212

9.4.3 非树结构的处理 214

9.5 标注样例(CJPL2224725) 215

9.5.1 原文 215

9.5.2 标注结果 216

参考文献 217

索 引 234

后 记 236

返回顶部