第一部分 文本摘要技术 3
第1章 文本摘要概述 3
1.1 摘要技术的需求 3
1.2 自动文本摘要的应用 5
1.3 文本摘要分类 6
第2章 摘要评价方法 9
2.1 评价数据 9
2.1.1 抽取式摘要数据集 9
2.1.2 生成式摘要数据集 10
2.2 评价指标 13
2.2.1 自动评测 13
2.2.2 人工评测 16
2.2.3 半自动评测 16
2.3 总结 17
第二部分 信息抽取 23
第3章 文本表示 23
3.1 词级表示 23
3.1.1 Word2Vec 23
3.1.2 循环神经网络 33
3.2 句级表示 38
3.2.1 Paragraph Vector模型 38
3.2.2 Skip-Thoughts文档-句子表示 40
3.2.3 卷积神经网络 41
3.3 文档级表示 45
3.3.1 混合模型 45
3.3.2 BERT 46
第4章 命名实体识别 55
4.1 命名实体识别简介 56
4.1.1 命名实体概念 56
4.1.2 命名实体的用途 56
4.2 命名实体识别方法 57
4.2.1 基于规则的方法 58
4.2.2 支持向量机 58
4.2.3 最大熵模型 59
4.2.4 隐马尔可夫模型 61
4.2.5 条件随机场 63
4.2.6 Bi-LSTM+CRF模型 64
第5章 抽取式摘要 67
5.1 无监督方法 68
5.1.1 启发规则方法 68
5.1.2 向量空间模型 70
5.1.3 基于图的模型 70
5.1.4 组合优化方法 73
5.2 有监督方法 76
5.2.1 分类模型 76
5.2.2 句子打分与排序 78
5.3 强化学习 80
5.3.1 基本原理 80
5.3.2 强化学习优化的抽取式摘要 83
5.4 总结 85
第三部分 文本生成 91
第6章 神经网络文本生成模型 91
6.1 语言模型 91
6.2 “编码-解码”网络框架 92
6.2.1 模型框架 92
6.2.2 注意力机制 95
6.3 “序列到序列”生成模型 96
6.4 网络训练 100
6.4.1 Sampled Softmax算法 100
6.4.2 Beam Search算法 101
6.4.3 随机梯度下降算法 103
6.5 面临的问题 104
第7章 生成式摘要 107
7.1 未登录词问题解决方案 107
7.1.1 复制机制 108
7.1.2 指针机制 108
7.2 生成重复词问题解决方案 113
7.2.1 注意力改进方法 113
7.2.2 覆盖机制 114
7.2.3 分散机制 115
7.3 生成错误关系问题 116
7.4 长文本摘要生成问题 118
7.4.1 注意力改进方法 118
7.4.2 卷积seq2seq模型 120
7.5 强化学习优化的生成式摘要 122
7.6 抽取器+生成器 124
7.6.1 抽取器+指针生成网络 125
7.6.2 强化抽取器+生成器 125
7.7 总结 125
附录A 专用名词缩写 127
索引 129
后记 131
参考文献 133