《术语学与术语信息处理》PDF下载

购买积分：9 如何计算积分？
作　　者：张榕著
出版社：北京：中国社会科学出版社
出版年份：2015
ISBN：9787516160916
页数：192 页

图书介绍：术语在语言词汇中所占的比例逐年增加，术语学的研究也越来越受到学界的关注。深入系统的术语研究不仅从语言学的角度上来说是必要的，而且从语言信息处理的角度来说，也具有实际的应用价值。主要有以下内容：关于什么是术语的可操作性界定；面向大规模文本的术语定义抽取方法；术语定义的领域聚类方法；术语定义抽取基础上的术语识别方法。

点击购买此书全本PDF电子书

第一章引论 1

第一节本研究提出的背景 1

一术语定义自动抽取的必要性 1

二术语定义的聚类的意义 6

三术语识别的意义 7

第二节国内外研究现状 7

一术语定义抽取的研究现状 7

二句子聚类的国内外研究 9

三术语识别的研究现状 11

第三节术语学介绍 15

一什么是术语学 15

二术语学的发展简介 16

三术语学的主要流派 16

四我国的术语学研究 17

五术语数据库 19

六术语概念的唯一性与术语定义的多样性 22

七术语与普通词语 25

八术语的跨语言借用 30

九新术语与旧术语在定义出现概率上的区别 35

十术语的语缀 36

十一一些基本概念 39

第四节术语与术语定义的界定 42

一术语的界定 42

二术语定义的界定 47

第二章术语定义的抽取研究 51

第一节候选术语定义的规则匹配 51

一文本下载 51

二文本的预处理 52

三文本的分词 53

四候选术语定义的模板匹配 54

第二节基于统计方法的术语定义抽取 62

一词语的定义隶属度 63

二句子的定义隶属度 67

三句子的定义隶属度实验结果 67

第三节向量空间距离计算 69

一向量空间模型介绍 69

二向量空间模型的引用 71

三向量空间模型实验结果示例 72

第四节隶属度计算和向量空间模型的结合 74

第五节术语定义抽取系统结构与实验结果 75

第六节实验结果评价 77

一网络文本结构的多样性因素 77

二语言表达形式的多样性因素 80

三分词的因素 82

四网络文本的可靠性因素 83

五搜索引擎准确率的因素 84

六算法的因素 84

第七节术语定义形式的多样性 85

一传统意义上的定义形式 85

二下定义的要求 86

三术语定义形式的多样性 89

第八节本章小结 91

第三章术语定义的聚类研究 93

第一节术语定义聚类的必要性 93

第二节聚类综述 96

一聚类与聚类分析 96

二分类与聚类 97

三硬聚类和软聚类 97

四层级聚类与非层级聚类 98

第三节本研究采用的聚类方法 99

一聚类步骤 99

二相似度的界定和属性的选取 99

三《知网》介绍 100

第四节术语定义的领域聚类 107

一句子相似度计算 107

二词语的相似度计算 108

三术语定义领域聚类的停用词表的建立 112

四聚类特征的选取 112

第五节术语定义聚类的结果及分析 115

一领域聚类的判定复杂性 115

二聚类相似度阈值的设定 116

三《知网》知识库在领域聚类中的优点与局限性 116

四聚类结果的错误分析 119

第四章术语自动识别研究 122

第一节术语缺乏位置信息 122

第二节术语的抽取 124

一术语的语言学特征 124

二术语的粗抽取 124

三术语边界的确定 126

四术语的词性过滤 129

五术语词性序列的统计 133

第三节候选术语的统计特征 136

一术语的用词长度特征 136

二候选术语的长度与词频计算 139

三候选术语的最后得分 141

第四节过滤词表的构建 143

一术语识别过滤词表构建的必要性 143

二过滤词表的构建 145

第五节术语识别系统结构与实验结果 145

第六节实验结果分析 146

一定义匹配模板的局限性 146

二句子定义隶属度过低 147

三其他情况 148

第七节本章小结 149

第五章结束语 150

附录 156

附录一《人民日报》用词与术语定义用词对比 156

附录二词语的定义隶属度 162

附录三术语定义抽取的分步骤结果示例 164

附录四术语的词性序列 168

附录五术语抽取结果 169

附录六术语定义聚类的部分结果 171

附录七术语定义聚类程序示例 179

参考文献 184

致谢 192