《人工智能与机器人先进技术丛书 智能摘要与深度学习》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:高扬
  • 出 版 社:北京:北京理工大学出版社
  • 出版年份:2019
  • ISBN:9787568269025
  • 页数:143 页
图书介绍:在Web2.0到Web3.0飞跃的时代,互联网数据体量以惊人地速度增强。过去以检索为主导的信息获取方式已无法满足人们对增量信息的需求。另外,由于社交需求和人工智能技术对互联网科技的冲击,对人们阅读习惯也产生了翻天覆地的变化。人们还少可以用长时间认真地阅读某个相关主题的所有信息,取而代之的是碎片化阅读习惯。这样,互联网的信息展示形式就需要深度加工,变成以短小、凝练、流畅、趣味性等为导向的摘要形式,展示给用户和读者。针对实际应用需求,面对海量信息,自动文摘技术利用计算机自动地从原始数据中提取文摘,以简洁连贯的短文反映数据中心内容,可以有效地辅助用户在短时间内从海量数据中获得主要信息。该书将从背景、需求入手,以最直接有效的方法切入,讲解如何搭建摘要系统。对摘要领域的算法做深入剖析,并对未来研究趋势做规划和预测。

第一部分 文本摘要技术 3

第1章 文本摘要概述 3

1.1 摘要技术的需求 3

1.2 自动文本摘要的应用 5

1.3 文本摘要分类 6

第2章 摘要评价方法 9

2.1 评价数据 9

2.1.1 抽取式摘要数据集 9

2.1.2 生成式摘要数据集 10

2.2 评价指标 13

2.2.1 自动评测 13

2.2.2 人工评测 16

2.2.3 半自动评测 16

2.3 总结 17

第二部分 信息抽取 23

第3章 文本表示 23

3.1 词级表示 23

3.1.1 Word2Vec 23

3.1.2 循环神经网络 33

3.2 句级表示 38

3.2.1 Paragraph Vector模型 38

3.2.2 Skip-Thoughts文档-句子表示 40

3.2.3 卷积神经网络 41

3.3 文档级表示 45

3.3.1 混合模型 45

3.3.2 BERT 46

第4章 命名实体识别 55

4.1 命名实体识别简介 56

4.1.1 命名实体概念 56

4.1.2 命名实体的用途 56

4.2 命名实体识别方法 57

4.2.1 基于规则的方法 58

4.2.2 支持向量机 58

4.2.3 最大熵模型 59

4.2.4 隐马尔可夫模型 61

4.2.5 条件随机场 63

4.2.6 Bi-LSTM+CRF模型 64

第5章 抽取式摘要 67

5.1 无监督方法 68

5.1.1 启发规则方法 68

5.1.2 向量空间模型 70

5.1.3 基于图的模型 70

5.1.4 组合优化方法 73

5.2 有监督方法 76

5.2.1 分类模型 76

5.2.2 句子打分与排序 78

5.3 强化学习 80

5.3.1 基本原理 80

5.3.2 强化学习优化的抽取式摘要 83

5.4 总结 85

第三部分 文本生成 91

第6章 神经网络文本生成模型 91

6.1 语言模型 91

6.2 “编码-解码”网络框架 92

6.2.1 模型框架 92

6.2.2 注意力机制 95

6.3 “序列到序列”生成模型 96

6.4 网络训练 100

6.4.1 Sampled Softmax算法 100

6.4.2 Beam Search算法 101

6.4.3 随机梯度下降算法 103

6.5 面临的问题 104

第7章 生成式摘要 107

7.1 未登录词问题解决方案 107

7.1.1 复制机制 108

7.1.2 指针机制 108

7.2 生成重复词问题解决方案 113

7.2.1 注意力改进方法 113

7.2.2 覆盖机制 114

7.2.3 分散机制 115

7.3 生成错误关系问题 116

7.4 长文本摘要生成问题 118

7.4.1 注意力改进方法 118

7.4.2 卷积seq2seq模型 120

7.5 强化学习优化的生成式摘要 122

7.6 抽取器+生成器 124

7.6.1 抽取器+指针生成网络 125

7.6.2 强化抽取器+生成器 125

7.7 总结 125

附录A 专用名词缩写 127

索引 129

后记 131

参考文献 133