《面向语言信息处理的现代汉语并列结构研究》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:吴云芳著
  • 出 版 社:北京:北京师范大学出版社
  • 出版年份:2013
  • ISBN:9787303162673
  • 页数:279 页
图书介绍:本书基于语料库详尽地考察了现代汉语并列结构形成的语言规律,回答了现代汉语中什么成分和什么成分可以并列以及什么成分和什么成分不可以并列这一原则性问题,为真实文本中并列结构的计算机自动处理储备了充足的知识。

引论 1

一、研究的意义 1

二、研究的方法 4

三、全书的组织 10

上编 基于语料库的并列结构语言研究 15

第一章 并列结构研究的理论基础 15

一、关于现代汉语并列结构的理论主张 15

二、现代汉语并列结构描述的理论体系 26

三、无标记并列结构和有标记并列结构 33

第二章 无标记并列结构研究 37

一、概述 37

二、n+n形成的并列结构 39

三、v+v形成的并列结构 64

四、a+a形成的并列结构 80

五、本章小结 85

第三章 有标记并列结构研究 86

一、概述 86

二、同词类形成的有标记并列结构 87

三、异词类形成的有标记并列结构 159

四、有标记并列结构的外部句法特征 178

五、本章小结 184

第四章 并列标记研究 185

一、概述 185

二、主要连接体词性成分的并列标记“与”“及” 190

三、主要连接动词性成分的并列标记“并” 198

四、主要连接形容词性成分的并列标记“而” 201

五、表示列举的并列标记“、” 204

六、表示析取关系的并列标记“或” 206

七、从并列标记系统看并列标记 208

八、并列标记与多项并列结构 210

九、本章小结 216

下编 面向真实文本的并列结构信息处理研究 219

第五章 规则方法的并列结构自动识别 219

一、概述 219

二、中心词驱动的并列结构识别策略 219

三、简单短语的捆绑 221

四、并列结构边界范围的划定 222

五、不同短语类型并列结构的自动分类 223

六、不同短语类型并列结构的自动边界识别 224

七、基于词串相似度的识别算法 227

八、实验结果与分析 228

九、本章小结 232

第六章 统计方法的并列结构自动识别 233

一、概述 233

二、基于SVM识别并列结构 233

三、特征选择 234

四、实验结果 236

五、本章小结 238

第七章 基于并列结构的同义词集自动获取 239

一、概述 239

二、并列结构数据的采集与实验评价方法 240

三、Newman方法的设计与实验 241

四、基于Newman方法的改进研究 243

五、本章小结 249

第八章 结语 251

一、本书研究的成果 251

二、本书研究的意义 253

三、进一步研究的工作计划 257

附录1 本书所使用的语类标记集 259

附录2 手工标注的有标记并列结构样例 260

附录3 CCD的基本语义类 262

附录4 并列结构规则的形式描述语言 264

附录5 同义词集聚类结果示例 267

参考文献 268