词语计算与应用PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:刘华著
- 出 版 社:广州:暨南大学出版社
- 出版年份:2010
- ISBN:9787811354881
- 页数:268 页
1 领域新词语快速获取 1
1.1 新词语识别和聚类综述 1
1.2 基于分类网页链接分析的领域新词语发现 3
1.3 分类新词语分析 5
1.3.1 词语抽取的准确率与排错处理 5
1.3.2 抽取词语的新词率 8
1.3.3 新词语在切分中的作用 11
1.3.4 新词语的强文本表示功能 17
小结 18
参考文献 19
2 词语分类和词语聚类 21
2.1 词语分类和词语聚类综述 21
2.2 基于分类特征提取的词语分类 22
2.2.1 定义说明 22
2.2.2 特征提取方法分析 23
2.2.3 词语表与训练语料介绍 25
2.2.4 算法实现 27
2.2.5 实验结果分析 28
2.2.6 实验结果举例 32
2.3 基于大规模分类语料库关键词标引的词语聚类 37
2.3.1 超大规模分类语料库和词语表说明 38
2.3.2 利用关键词标引确定种子词语 39
2.3.3 在大规模分类语料库中聚类词语 58
2.3.4 聚类词语集成 61
2.3.5 算法实现 70
2.3.6 实验结果和分析 71
小结 91
参考文献 91
3 词语计算与辅助汉语教学 93
3.1 计算机辅助汉语教学综述 93
3.2 辅助汉语教学的语料库建设 94
3.3 词语搭配自动获取 95
3.4 词汇常用度计算 99
3.5 例句难易度计算 102
3.6 基于语料库的对外汉语教学用分类词表的研制 103
3.6.1 分类词表的特点和任务描述 105
3.6.2 分类词表的研制原理 106
3.6.3 分类词表的研制流程 107
3.6.4 几点说明 113
3.7 面向对外汉语教学的话题聚类研究 117
3.7.1 报刊阅读与话题课 117
3.7.2 话题与话题词簇 118
3.7.3 报刊阅读课现状分析与目标描述 119
3.7.4 系统实现及结果分析 122
小结 130
参考文献 130
4 词语主题度计算与自动标引 133
4.1 词语主题度数学模拟 133
4.1.1 词语主题度计算的理论基础 133
4.1.2 词语主题度数学模拟 133
4.2 基于词语主题度的标引知识自动获取 136
4.2.2 专家标引的网页关键词获取 136
4.2.2 关键词主题度计算 137
4.3 基于词语主题度的文献综合自动标引 139
4.3.1 文献综合自动标引概述 139
4.3.2 文献综合自动标引总体流程 140
4.3.3 关键词文档权重计算 141
4.3.4 关键词自动标引实现 141
4.3.5 自动文摘实现 151
4.3.6 基于关键短语的立体文本分类模型 151
4.4 文献情报自动标引系统介绍 175
4.4.1 系统概述 175
4.4.2 面向的行业类型 175
4.4.3 功能模块 176
小结 178
参考文献 179
附录1 网络新闻用层级分类体系 185
附录2 15大类分类词语表 191
附录3 244个层级小类分类词语 207
附录4 聚类种子词语 215
附录5 聚类词语 227
附录6 HSK(商务)词语表 262
后记 266
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《虚拟流域环境理论技术研究与应用》冶运涛蒋云钟梁犁丽曹引等编著 2019
- 《当代翻译美学的理论诠释与应用解读》宁建庚著 2019
- 《计算机辅助平面设计》吴轶博主编 2019
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019