信息技术领域新术语提取研究 in the field of information technologyPDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:王强军著
- 出 版 社:呼和浩特:内蒙古人民出版社
- 出版年份:2005
- ISBN:7204056086
- 页数:208 页
序 张普 1
前言 1
第一章 绪论 1
第一节 课题的提出 1
第二节 本研究的定位 3
一、术语自动提取 3
二、基于大规模动态流通语料库 4
三、以信息技术领域为切入点 5
四、描述性的术语工作 6
第三节 本书中一些指称的界定 7
第四节 本研究的方法和技术路线 10
一、用接续指数确定字符串的词语度 10
二、用TFIDF和领域相减确定字符串的术语度 11
第五节 本研究的工作流程和实验目标 12
一、本研究的工作流程 12
二、本研究的实验目标和实验结果 13
第六节 本研究的贡献 14
第七节 本书的内容安排 15
第二章 术语学研究及其对术语提取的指导 17
第一节 引言 17
第二节 术语学相关研究 17
一、术语的定义 17
二、术语定义的三个含义 19
三、术语的基本特征 24
四、作为提取对象的术语的特征 26
五、术语和一般词语的关系 30
七、新术语的特点 33
六、新术语 33
八、新术语提取的基本思路 34
第三节 术语提取相关研究 34
一、作为提取对象的术语的分类 34
二、术语提取的定义 37
三、术语提取跟其他自然语言处理研究的关系 38
四、术语提取的方法 39
五、术语提取的工作模式 41
第四节 本章小结 45
第三章 动态语言知识更新 46
第一节 本研究的理论基础及背景介绍 46
一、流通度理论简介 46
二、动态语言知识更新理论 49
三、动态流通语料库(DCC) 51
四、国家语言资源监测与研究中心(平面媒体) 53
五、DCC建设情况 54
第二节 本研究的总体规划和实验流程设计 58
一、本研究的总体规划 58
二、本研究的提取方法和策略 59
第三节 本研究的资源建设和系统开发 60
一、动态流通语料库扩展规划 60
二、术语数据库建设 64
三、统一的语料库建设和术语提取系统 64
第四节 本章小结 68
第四章 术语提取技术分析 69
第一节 引言 69
一、词语度和术语度 69
二、术语的统计学特征 69
第二节 接续指数概念的引入 70
第三节 接续指数及相关术语 73
第四节 接续指数的理论基础 75
第五节 接续指数分析 75
一、接续指数与频率的关系 75
二、接续指数与字符串的关系 79
三、前接指数和后续指数的关系 82
四、接续指数为0的情况 83
第六节 接续指数在术语提取中的应用 88
一、术语提取的范围划定 88
二、术语的接续指数分析 89
三、字符串词语度判断 92
第七节 术语度的判断 93
一、定义 95
第八节 TFIDF介绍 95
二、各参数的取值 97
第九节 TFIDF在术语提取中的作用 98
第十节 TFIDF在术语提取中的不足 103
第十一节 领域相减介绍 105
一、领域相减的定义 105
二、关于领域距离 105
三、学科领域的划分 106
第十二节 领域相减的作用和不足 108
第十三节 两者相结合的方法 109
第十四节 本章小结 109
第二节 IT领域语料库的建设 110
一、建设原则和基本方案 110
第一节 引言 110
第五章 基于DCC的术语提取和更新实验系统 110
二、语料获取和存储 112
第三节 术语提取和更新实验系统介绍 114
一、系统概述 114
二、输入和输出 115
三、各模块介绍 115
四、系统小结 141
第四节 术语提取实验 147
一、实验所用的语料 147
二、实验所用的术语词典 148
三、实验的硬软件环境 148
四、实验流程 149
五、提取结果分析 150
六、新术语提取结果 158
第五节 本章小结 164
第六章 结论和展望 166
第一节 全书总结 166
第二节 今后的工作 168
附录1 CCW02切分结果统计 171
附录2 不同长度的字符串在各频率段的分布 172
附录3 语料库各部分代码 174
附录4 接续指数举例 175
附录5 部分无人工干预的提取结果(一) 179
附录6 部分无人工干预的提取结果(二) 184
附录7 提取结果:新术语(2字) 189
附录8 提取结果:命名实体(2字) 193
参考文献 198
后记 205
- 《红色旅游的社会效应研究》吴春焕著 2019
- 《汉语词汇知识与习得研究》邢红兵主编 2019
- 《生物质甘油共气化制氢基础研究》赵丽霞 2019
- 《东北民歌文化研究及艺术探析》(中国)杨清波 2019
- 《联吡啶基钌光敏染料的结构与性能的理论研究》李明霞 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《《国语》和《战国策》词汇比较研究》陈长书著 2017
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《行政保留研究》门中敬著 2019
- 《新课标背景下英语教学理论与教学活动研究》应丽君 2018
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《近代中国分省人文地理影像采集与研究 内蒙古》《近代中国分省人文地理影像采集与研究》编写组 2019
- 《国之重器出版工程 云化虚拟现实技术与应用》熊华平 2019
- 《新闻出版博物馆 总第33期》新闻出版博物馆 2018
- 《内蒙古荒漠草原退化与生态修复》蒙仲举 2017
- 《哈佛出版史》董唯责编;李广良,张琛译者;(美)马克斯·豪尔 2019
- 《古人的日子 己亥年历 2019版》廉萍,扬之水 2018
- 《古人的餐桌》(中国)芮新林 2019
- 《新时代期刊编辑出版的理论与实践》吴厚庆 2019