《先秦文献信息处理》PDF下载

购买积分：12 如何计算积分？
作　　者：陈小荷编
出版社：北京：世界图书北京出版公司
出版年份：2013
ISBN：9787510056611
页数：323 页

图书介绍：本书研究先秦文献的信息处理，包括词汇和历史知识的处理与智能检索。先秦汉语是汉语可以溯及的源头，对先秦文献做词汇处理，目的在于追本溯源，了解先秦汉语词汇的基本面貌。用计算语言学方法梳理这一时期的历史事件、人名、地名等知识，有助于更好地理解先秦文献。与现当代中文文献相比，先秦传世文献规模很小，但相关的注疏文献十分丰富。因此该书采用了与一般中文信息处理不同的方法——基于注疏文献的方法。对比实验表明，这种方法在先秦文献信息处理中具有显著的优势。

点击购买此书全本PDF电子书

第一章绪论 1

第一节先秦文献 1

第二节先秦文献信息处理 4

第三节先秦文献信息处理的特点 9

第四节基于注疏文献的处理方法 10

第二章注疏文献处理 18

第一节注疏文献的选取 18

第二节注疏文献的内容分析 27

第三节先秦文献与其注疏文献的句子对齐和注释对齐 36

第三章词语切分 56

第一节先秦汉语分词规范 57

第二节基于统计模型的自动分词方法 69

第三节利用注疏文献的自动分词方法 81

第四章词性标注 92

第一节词类体系 93

第二节基于统计的分词标注一体化方法 98

第三节基于注疏文献的词性校正 107

第五章古今字、通假字资源建设 126

第一节古今字、通假字研究现状 126

第二节古今字、通假字数据库的构建 130

第三节通假字标注实验 136

第四节实验结果及其分析 137

第六章词汇概貌 146

第一节语料来源和说明 146

第二节先秦文献的汉字统计 148

第三节先秦文献的词汇统计 154

第四节计算每种文献的特色词 161

第五节成语来源统计 166

第七章词义消歧 169

第一节古代汉语词义特点和消歧难点 170

第二节义项区分的颗粒度 171

第三节基于CRF模型的消歧实验 177

第四节分类器集成的消歧实验 191

第八章专名标注 216

第一节关于“专名”和“命名实体”的辨析 217

第二节先秦时期的人名与地名 218

第三节基于统计的专名识别 224

第四节基于注疏文献的专名识别 231

第五节人名所指歧义消解 242

第六节基于专名标注的事件划分 254

第九章版本异文发现 261

第一节异文和版本异文 261

第二节个案和研究方法 263

第三节基于相似度计算的句珠配对 265

第四节基于同文排除的异文配对 269

第五节基于双序列比对的一体化处理 272

第六节实验结果及其分析 275

第十章《左传》中的春秋社会网络分析 283

第一节社会网络分析的基本方法和软件 284

第二节社会关系数据的获取和网络的定义 286

第三节人物-事件网络分析 291

第四节人物关系网络分析 296

第五节人物关系网络的深入分析 303

后记 321