第一章 绪论 1
第一节 先秦文献 1
第二节 先秦文献信息处理 4
第三节 先秦文献信息处理的特点 9
第四节 基于注疏文献的处理方法 10
第二章 注疏文献处理 18
第一节 注疏文献的选取 18
第二节 注疏文献的内容分析 27
第三节 先秦文献与其注疏文献的句子对齐和注释对齐 36
第三章 词语切分 56
第一节 先秦汉语分词规范 57
第二节 基于统计模型的自动分词方法 69
第三节 利用注疏文献的自动分词方法 81
第四章 词性标注 92
第一节 词类体系 93
第二节 基于统计的分词标注一体化方法 98
第三节 基于注疏文献的词性校正 107
第五章 古今字、通假字资源建设 126
第一节 古今字、通假字研究现状 126
第二节 古今字、通假字数据库的构建 130
第三节 通假字标注实验 136
第四节 实验结果及其分析 137
第六章 词汇概貌 146
第一节 语料来源和说明 146
第二节 先秦文献的汉字统计 148
第三节 先秦文献的词汇统计 154
第四节 计算每种文献的特色词 161
第五节 成语来源统计 166
第七章 词义消歧 169
第一节 古代汉语词义特点和消歧难点 170
第二节 义项区分的颗粒度 171
第三节 基于CRF模型的消歧实验 177
第四节 分类器集成的消歧实验 191
第八章 专名标注 216
第一节 关于“专名”和“命名实体”的辨析 217
第二节 先秦时期的人名与地名 218
第三节 基于统计的专名识别 224
第四节 基于注疏文献的专名识别 231
第五节 人名所指歧义消解 242
第六节 基于专名标注的事件划分 254
第九章 版本异文发现 261
第一节 异文和版本异文 261
第二节 个案和研究方法 263
第三节 基于相似度计算的句珠配对 265
第四节 基于同文排除的异文配对 269
第五节 基于双序列比对的一体化处理 272
第六节 实验结果及其分析 275
第十章《左传》中的春秋社会网络分析 283
第一节 社会网络分析的基本方法和软件 284
第二节 社会关系数据的获取和网络的定义 286
第三节 人物-事件网络分析 291
第四节 人物关系网络分析 296
第五节 人物关系网络的深入分析 303
后记 321