![面向非结构化文本的知识发现 基于英汉双语平行语料库的句法级知识挖掘和抽取研究](https://cover.qianqiantushu.cc/71/s68a19f5.jpg)
![面向非结构化文本的知识发现 基于英汉双语平行语料库的句法级知识挖掘和抽取研究](https://cover.qianqiantushu.cc/71/s68a19f5.jpg)
面向非结构化文本的知识发现 基于英汉双语平行语料库的句法级知识挖掘和抽取研究PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:王东波编
- 出 版 社:北京:中国社会科学出版社
- 出版年份:2013
- ISBN:9787516126035
- 页数:220 页
第一章 引言 1
一 课题提出 1
二 研究意义 2
三 研究方法 4
四 研究技术路线 5
五 研究创新点 7
六 本书结构和所用资源 8
第二章 相关研究综述 10
一 面向网络获取相关英汉双语平行语料的概述 10
二 词汇句法功能分布的相关研究概况 23
三 短语结构知识抽取的相关研究综述 33
四 类别知识挖掘的相关研究 41
第三章 面向网络的英汉双语平行语料库自动构建 48
一 确定获取语料网站和制定抓取词汇底表 48
二 网页的抓取和英汉双语平行语料的抽取 53
第四章 词汇句法功能分布复杂度呈现规律的知识挖掘 64
一 词汇句法功能分布复杂度统计数据源简介和句法结构调整 64
二 词汇句法功能分布复杂度的获取 81
三 词汇句法功能分布复杂度的洛特卡现象揭示 96
第五章 基于英汉双语平行语料库的短语结构知识抽取——以介宾短语结构为例 114
一 英汉双语介宾短语结构句法特征统计分析 115
二 有关介宾短语结构知识抽取模型构建的相关介绍和预处理 135
三 介宾短语结构知识抽取模型的确定和英汉双语介宾短语结构知识的抽取 147
第六章 基于英汉双语平行语料库的复杂短语级类别知识挖掘 152
一 面向英汉双语专门复杂短语平行语料的聚类和词干或词形算法确定 152
二 语料的预处理和相关统计 157
三 面向英汉双语复杂短语平行语料的词性选择 166
四 基于英汉双语复杂短语平行语料的类别知识挖掘 171
结语 181
参考文献 183
附录1宾州大学英语树库的词性标记 199
附录2宾州大学汉语树库的词性标记 200
附录3清华大学树库词性标记 201
附录4汉语自身特征模板 203
附录5英语自身特征模板 205
附录6汉语添加特征模板 207
附录7英语添加特征模板 210
附录8中国科学院和北京大学核心词性标注集 213
附录9BNC统计语料样例 214
后记 217
- 《汉语词汇知识与习得研究》邢红兵主编 2019
- 《联吡啶基钌光敏染料的结构与性能的理论研究》李明霞 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《弹好钢琴必备的五线谱知识》杨青华威武 2019
- 《国家执业药师考试历年真题试卷全解 2015-2019 中药学专业知识 1》黄坤主编 2020
- 《初中物理知识地图》赵端旭 2017
- 《国家教师资格考试辅导教材 思维导图全解 教育教学知识与能力 小学》师大教科文教材编写组 2020
- 《柏里曼人体结构绘画教学描摹本 第2册 头手足结构》杨建飞主编 2019
- 《中药学专业知识 1 国家执业药师考试指南 第7版 2019版》国家药品监督管理局执业药师资格认证中心 2018
- 《2017国家执业药师资格考试 全考点实战通关必备 中药学综合知识与技能 第3版》国家执业药师资格考试命题研究专家组 2017
- 《红色旅游的社会效应研究》吴春焕著 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019