语料库翻译学文库 语料库与Python应用PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:管新潮
- 出 版 社:上海:上海交通大学出版社
- 出版年份:2018
- ISBN:9787313197481
- 页数:211 页
第1章 绪论 1
1.1 语料库与Python 1
1.1.1 语料库的若干维度 1
1.1.2 语料库的技术实现 2
1.2 本书概要 3
上篇 语料文本的基础性代码 7
第2章 语料文本的读取及其运行结果的输出 7
2.1 概述 7
2.2 语料文本的读取 8
2.2.1 读取NLTK固有语料库 8
2.2.2 读取自制语料库 10
2.2.3 读取非独立存储的语料文本 15
2.2.4 读取docx格式的语料文本 16
2.2.5 读取xlsx格式的语料文本 19
2.3 语料文本运行结果的输出 20
2.3.1 操作界面直接输出结果 20
2.3.2 输出txt文件格式 22
2.3.3 输出xlsx文件格式 25
2.4 中文语料文本的读取和结果输出 26
2.4.1 自制语料库 26
2.4.2 非独立存储的语料文本 29
第3章 语料库应用的基础性代码 30
3.1 概述 30
3.2 停用词的使用 31
3.2.1 不同语种的停用词 31
3.2.2 自有停用词的设置 32
3.3 文本降噪代码 34
3.3.1 具体代码的功用 35
3.3.2 组合使用代码的功用 38
3.3.3 降噪与文本计数 39
3.4 语料文本的语言学处理代码 40
3.4.1 字母大小写转换 40
3.4.2 词形还原 42
3.4.3 文本分句或分词 44
3.4.4 词性标注 47
3.5 语料库词频排序 51
3.5.1 简单词频排序 51
3.5.2 降噪处理后词频排序 53
3.5.3 清除停用词后排序 54
3.6 语料库检索与统计 55
3.6.1 上下文关键词检索 55
3.6.2 类符形符比 57
3.6.3 N连词提取 62
3.6.4 指定词检索与统计 66
3.7 中文语料文本的处理方法 68
3.7.1 上下文关键词检索 69
3.7.2 中文停用词 70
第4章 数据可视化 74
4.1 概述 74
4.2 表格绘制 74
4.3 图形绘制 78
4.3.1 词频图形绘制 78
4.3.2 柱状图和点状图绘制 80
4.4 词云图绘制 81
4.4.1 英文文本词云图 82
4.4.2 中文文本词云图 83
第5章 代码运行错误分析 89
5.1 概述 89
5.2 错误分析案例 90
5.2.1 输入输出错误(IOError) 90
5.2.2 对象属性错误(AttributeError) 92
5.2.3 数据类型错误(TypeError) 94
5.2.4 变量名称错误(NameError) 96
5.2.5 索引错误(IndexError) 98
5.2.6 缩进错误(IndentationError) 100
5.2.7 参数类型错误(ValueError) 102
5.2.8 语法错误(SyntaxError) 104
5.2.9 Unicode解码错误(UnicodeDecodeError) 105
5.2.10 关键字错误(KeyError) 106
中篇 基础性代码的组合使用 111
第6章 算法、代码与编程 111
6.1 篇章结构 111
6.2 算法和代码 112
6.2.1 算法 112
6.2.2 代码 113
6.3 选择不同代码的影响 115
6.3.1 分词处理方式对后续文本分析的影响 115
6.3.2 不同的降噪效果 117
6.3.3 链表、字符串、元组和字典对比 118
6.3.4 停用词的功用 121
6.4 Python与既有语料库工具的关系 122
第7章 基础性代码的语料库组合应用 125
7.1 以Excel文件格式输出术语(类符) 125
7.1.1 简单输出术语 125
7.1.2 按词频输出术语 128
7.2 以Excel文件格式输出表格 132
7.3 语篇词汇密度的计算 135
7.4 语篇词汇复杂性的计算 139
7.5 语篇词长分布的计算 142
7.6 NLTK固有语料库 146
7.6.1 总统就职演说语料库 147
7.6.2 华尔街杂志语料库 149
7.6.3 其他相关语料库介绍 152
下篇 Python探索路径 159
第8章 Python的语料库拓展应用 159
8.1 概述 159
8.2 单语语料导入Excel工作簿 160
8.3 KWIC检索功能的拓展 166
8.4 语篇词形还原 170
8.5 术语提取效果的改进 174
8.6 语篇段落对齐 180
8.7 应用语言学文献计量研究的数据提取 182
8.8 专业通用词的提取路径探索 185
附录1 与本书相关的加载模块与函数命令对应表 194
附录2 Python2和Python3部分代码对比 197
附录3 部分NLTK固有语料库 200
附录4 汉英对照术语表 203
索引 207
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《当代翻译美学的理论诠释与应用解读》宁建庚著 2019
- 《社会文化系统中的翻译》姜秋霞,杨正军 2019
- 《2020考研英语大趋势 历年真题完形+翻译+新题型精讲精练》商志 2019
- 《大鱼文库 在路上》杰克·凯鲁亚克 2020
- 《天水师范学院60周年校庆文库 新工科视域下的工程基础与应用研究》《天水师范学院60周年校庆文库》编委会编 2019
- 《潜文本的阐释与翻译》刘早著 2019
- 《财经新闻翻译实践教程》胡婉,黄剑,王旭泉主编 2019
- 《光明社科文库 南岳旅游文化》刘国武,申秀英 2019
- 《ESG指标管理与信息披露指南》管竹笋,林波,代奕波主编 2019
- 《学校特色教育探索与实践》管升起著 2019
- 《经管类专门用途英语教程》张玉玲责任编辑;黄玉倩,管晓霞,尹平 2019
- 《管平湖古指法考》管平湖著 2019
- 《农业废弃物生物处理实用技术》管永祥 2016
- 《基于分子间氢键作用的有机染料的设计与光谱性质研究》王新潮,毕瑞明著 2019
- 《东莞当代文学艺术精品选 2010-2011 艺术卷 下》潘新潮主编;东莞市文学艺术界联合会编 2013
- 《仙剑问情 2 仙客风流》管平潮著 2013
- 《仙剑问情 3 御剑江湖》管平潮著 2013
- 《邓小平理论和“三个代表”重要思想概论 2005年版》管文虎主编 2005