《大数据环境下基于知识整合的语义计算技术与应用》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:蔡圆媛著
  • 出 版 社:北京:北京理工大学出版社
  • 出版年份:2018
  • ISBN:9787568261241
  • 页数:204 页
图书介绍:语义计算是理解自然语言的核心内容之一,有助于计算机量化、理解语句或文档的关联程度。依据语义资源的不同,典型的语义相似度计算方法分为基于知识库和基于语料库。知识库能够提供词汇的语义描述和结构化信息,但是严重依赖于领域专家的构建和维护,词汇覆盖率较低,缺乏可扩展性。而语料库虽然包含丰富的词汇,但是其非结构性导致难以从中提取词汇的有效语义特征。本书作者将在语义计算方向的科学研究成果进行总结整理,立足于基于知识整合的词汇语义相似度计算技术及其应用,提出整合两类语义资源的语义相似度计算方法,从语义特征的选择与提取、语义特征融合、语义计算这三方面内容梳理知识脉络。本书内容涉及当前主流的技术,如深度学习、文本向量化,附有大量的理论与技术介绍、实验数据、图表以及结果分析,帮助读者对于相关知识概念有一个较为清晰的认识。

第1章 引论 1

1.1 语义计算 1

1.1.1 语义网络 3

1.1.2 本体 4

1.1.3 语义网络与本体的联系 5

1.2 语义相似度 6

1.3 相关理论的演变与现状 10

1.3.1 基于知识库的概念语义相似度计算 10

1.3.2 基于语料库的单词语义相似度计算 11

1.4 本书主要内容与创新 14

1.4.1 基于IC模型的异构数据整合 15

1.4.2 基于语义特征的异构数据整合 16

1.4.3 基于度量方法的异构数据整合 16

第2章 语义相似度计算的相关理论 18

2.1 语义资源 18

2.1.1 知识库 19

2.1.2 语料库 26

2.2 基于图结构的概念语义相似度 27

2.2.1 概念语义相似度计算方法的分类 28

2.2.2 不同概念语义相似度计算方法的特征比较 31

2.3 文本的表示学习 33

2.3.1 独热表示 35

2.3.2 基于共现矩阵的向量空间模型 35

2.3.3 基于神经网络训练的稠密向量空间模型 38

2.4 基于向量空间的单词语义相似度 44

2.4.1 欧氏向量空间 44

2.4.2 概率向量空间 47

2.5 本章小结 48

第3章 基于IC加权最短路径的概念语义相似度计算 49

3.1 计算方法的分类 50

3.1.1 基于路径距离 50

3.1.2 基于信息含量 52

3.1.3 基于特征属性 54

3.1.4 混合式 56

3.2 概念的语义继承关系和结构属性 56

3.2.1 语义继承关系 57

3.2.2 知识库的图结构 59

3.3 结合IC与路径距离的混合式计算方法 61

3.3.1 计算元素的定义 61

3.3.2 固有IC混合模型 64

3.3.3 语义相似度计算策略 67

3.4 应用案例 69

3.4.1 基准数据集与评价标准 69

3.4.2 IC计算模型的设计选择 71

3.4.3 相似度计算策略中权重参数的有监督学习 74

3.4.4 相似度计算策略中权重参数的无监督选择 75

3.5 本章小结 77

第4章 基于多语义融合的单词语义相似度计算 79

4.1 概念向量的构建 79

4.1.1 利用知识库进行语料语义标记 80

4.1.2 利用聚类算法对相似词汇进行归类 80

4.2 向量的特征融合 83

4.2.1 相关背景知识 83

4.2.2 向量组合模型 84

4.3 多语义属性的融合模型 86

4.3.1 多语义融合(MSF)模型 87

4.3.2 基于语料的词向量训练 91

4.3.3 概念实体的定义与关系抽取 94

4.3.4 语义融合策略定义 95

4.3.5 构造语义增强词向量的多种策略 97

4.4 应用案例 101

4.4.1 词对相似度评测 103

4.4.2 语义Web服务匹配 112

4.5 本章小结 117

第5章 基于差分进化算法的单词语义相似度计算 119

5.1 差分进化算法 120

5.1.1 养分进化算法的原理 120

5.1.2 差分进化算法的流程 121

5.1.3 差分进化算法的组成 123

5.1.4 六种变异策略 124

5.1.5 常用的交叉策略 125

5.1.6 相关研究及应用 127

5.2 基于特征的有监督学习模型 129

5.2.1 回归学习 130

5.2.2 排序学习 132

5.3 基于差分进化算法的语义计算 134

5.3.1 方法组合策略 135

5.3.2 问题定义 136

5.3.3 向量相似度计算函数 136

5.3.4 算法描述 137

5.4 应用案例 140

5.4.1 基于无监督差分进化算法的相似度计算 141

5.4.2 基于有监督机器学习算法的相似度计算 145

5.4.3 原始词向量和语义增强词向量的空间探索 147

5.5 本章小结 151

第6章 知识整合的前世今生 152

6.1 知识图谱与深度学习的研究与应用 153

6.1.1 知识图谱 154

6.1.2 深度学习 160

6.1.3 典型应用 161

6.2 知识作为神经网络的输入 167

6.2.1 知识图谱的表示学习与推理 167

6.2.2 知识图谱向量化表示的应用 170

6.3 知识作为神经网络的约束 172

6.4 本章小结 173

附录 术语 174

参考文献 180