当前位置:首页 > 文化科学教育体育
先秦文献信息处理
先秦文献信息处理

先秦文献信息处理PDF电子书下载

文化科学教育体育

  • 电子书积分:12 积分如何计算积分?
  • 作 者:陈小荷编
  • 出 版 社:北京:世界图书北京出版公司
  • 出版年份:2013
  • ISBN:9787510056611
  • 页数:323 页
图书介绍:本书研究先秦文献的信息处理,包括词汇和历史知识的处理与智能检索。先秦汉语是汉语可以溯及的源头,对先秦文献做词汇处理,目的在于追本溯源,了解先秦汉语词汇的基本面貌。用计算语言学方法梳理这一时期的历史事件、人名、地名等知识,有助于更好地理解先秦文献。与现当代中文文献相比,先秦传世文献规模很小,但相关的注疏文献十分丰富。因此该书采用了与一般中文信息处理不同的方法——基于注疏文献的方法。对比实验表明,这种方法在先秦文献信息处理中具有显著的优势。
《先秦文献信息处理》目录

第一章 绪论 1

第一节 先秦文献 1

第二节 先秦文献信息处理 4

第三节 先秦文献信息处理的特点 9

第四节 基于注疏文献的处理方法 10

第二章 注疏文献处理 18

第一节 注疏文献的选取 18

第二节 注疏文献的内容分析 27

第三节 先秦文献与其注疏文献的句子对齐和注释对齐 36

第三章 词语切分 56

第一节 先秦汉语分词规范 57

第二节 基于统计模型的自动分词方法 69

第三节 利用注疏文献的自动分词方法 81

第四章 词性标注 92

第一节 词类体系 93

第二节 基于统计的分词标注一体化方法 98

第三节 基于注疏文献的词性校正 107

第五章 古今字、通假字资源建设 126

第一节 古今字、通假字研究现状 126

第二节 古今字、通假字数据库的构建 130

第三节 通假字标注实验 136

第四节 实验结果及其分析 137

第六章 词汇概貌 146

第一节 语料来源和说明 146

第二节 先秦文献的汉字统计 148

第三节 先秦文献的词汇统计 154

第四节 计算每种文献的特色词 161

第五节 成语来源统计 166

第七章 词义消歧 169

第一节 古代汉语词义特点和消歧难点 170

第二节 义项区分的颗粒度 171

第三节 基于CRF模型的消歧实验 177

第四节 分类器集成的消歧实验 191

第八章 专名标注 216

第一节 关于“专名”和“命名实体”的辨析 217

第二节 先秦时期的人名与地名 218

第三节 基于统计的专名识别 224

第四节 基于注疏文献的专名识别 231

第五节 人名所指歧义消解 242

第六节 基于专名标注的事件划分 254

第九章 版本异文发现 261

第一节 异文和版本异文 261

第二节 个案和研究方法 263

第三节 基于相似度计算的句珠配对 265

第四节 基于同文排除的异文配对 269

第五节 基于双序列比对的一体化处理 272

第六节 实验结果及其分析 275

第十章《左传》中的春秋社会网络分析 283

第一节 社会网络分析的基本方法和软件 284

第二节 社会关系数据的获取和网络的定义 286

第三节 人物-事件网络分析 291

第四节 人物关系网络分析 296

第五节 人物关系网络的深入分析 303

后记 321

相关图书
作者其它书籍
返回顶部