绪论 1
0.1 研究背景 1
0.2 本选题的意义 1
0.2.1 理论意义 2
0.2.2 方法意义 2
0.2.3 实践意义 2
0.3 研究概述 3
0.4 本书结构 4
0.5 小结 5
第一章 已有的摘要语步结构自动识别模型综述 6
1.1 关键概念 6
1.1.1 摘要 6
1.1.2 语类 7
1.1.3 语步 8
1.2 文本分类 8
1.2.1 定义及其发展 8
1.2.2 文本分类的一般步骤 9
1.2.3 文本分类器 10
1.3 现有的摘要语步自动识别模型 15
1.3.1 词袋模型 15
1.3.2 基于语境特征构建的模型 16
1.3.3 基于语言学特征构建的模型 18
1.3.4 现有模型的比较 22
1.4 现有模型对本研究的启示 24
1.5 小结 25
第二章 摘要的语类研究综述 26
2.1 语类研究综述 26
2.1.1 理论探索 27
2.1.2 实证研究 30
2.1.3 已有语类研究的不足 32
2.2 摘要研究综述 33
2.2.1 摘要的语类研究 33
2.2.2 摘要的语言特征研究 35
2.3 本研究的概念模型 45
2.4 小结 47
第三章 研究方法 49
3.1 研究问题 49
3.2 研究设计和研究流程 50
3.3 研究工具 51
3.3.1 语料处理工具 51
3.3.2 特征提取工具 54
3.3.3 模型构建与验证工具 55
3.4 语料 58
3.5 语料的人工标注 60
3.5.1 先导研究 61
3.5.2 第一次完整标注 63
3.5.3 标注员培训 66
3.5.4 第二次完整标注 67
3.5.5 人工标注的信度报告 69
3.6 建模前的语料准备 70
3.7 特征提取 72
3.7.1 形式特征提取 72
3.7.2 意义特征提取 81
3.7.3 语境特征提取 82
3.8 模型的构建与验证 83
3.9 小结 85
第四章 建模前的语步结构和语言特征描写 86
4.1 摘要的语步分析 86
4.1.1 语步类别的总体分布 86
4.1.2 实际结构 87
4.1.3 原型结构 91
4.1.4 衍生原则 92
4.1.5 类型与语类的关系 96
4.2 摘要的语步预测特征 99
4.2.1 形式特征 99
4.2.2 意义特征 105
4.2.3 语境特征 127
4.3 小结 131
第五章 摘要语步自动识别模型的构建与优化 132
5.1 基于概率的初步模型 132
5.1.1 模型识别度的判断指标 132
5.1.2 初步模型的识别度 133
5.1.3 构建初步模型的特征 136
5.2 基于统计和规则的优化模型 139
5.3 优化模型的识别效果 141
5.4 管道模型 144
5.5 模型的应用 146
5.6 小结 147
第六章 结论 148
6.1 研究发现 148
6.1.1 基于大量数据分析印证和完善了已有的语类理论 148
6.1.2 摘要语步的有效预测特征 149
6.1.3 摘要的语步结构自动识别模型 150
6.2 本研究的局限与未来研究方向 151
参考文献 153
附录 168