当前位置:首页 > 语言文字
语料库的制作与日语研究
语料库的制作与日语研究

语料库的制作与日语研究PDF电子书下载

语言文字

  • 电子书积分:9 积分如何计算积分?
  • 作 者:于康著;张威主编
  • 出 版 社:杭州:浙江工商大学出版社
  • 出版年份:2013
  • ISBN:9787811407068
  • 页数:181 页
图书介绍:自己制作日语语料库一直是国内日语专业的大学生、研究生和教师的一个愿望。过去,制作语料库由于受经费和技术要求的限制,一直只是少数一部分人的特权。本书的目的是手把手地教会大家如何利用免费软件来制作语料库和如何使用语料库,让每位读者拥有自己的语料库,以此进行各自的研究。内容主要包括语料的收集、PDF转换为文本文件的处理技巧、语料库的具体制作技术、语料库的使用、利用语料库研究日语的范例研究等。
《语料库的制作与日语研究》目录

第1章 语言资源的利用与语料库建设 1

1.1制作语料库的目的 1

1.2现在可供使用的主要语料库 2

1.3制作自己的语料库 5

1.4语料库的多元化用途 6

第2章 电脑配置、所需软件及软件的安装 8

2.1电脑的配置 8

2.2所需软件 8

2.2.1 Java 9

2.2.2 「秀丸」 9

2.2.3「えだまめ」 10

2.2.4「ひまわり」 10

2.3软件的下载和安装 10

2.3.1 Java的下载和安装 11

2.3.2「秀丸」的下载和安装 11

3.3.3「えだまめ」的下载和安装 14

2.3.4「ひまわり」的下载和安装 18

2.4小结 22

第3章 收集与保存语料 23

3.1收集语料时所需的设备和软件 23

3.1.1扫描仪 23

3.1.2 Adobe?Acrobat?9 Standard(或X,或Pro,或以上的版本) 25

3.1.3 JUST PDF 2[作成·高度編集·データ变换] 25

3.1.4 OCR软件 25

3.1.5「秀丸」 26

3.2建立保存语料用的文件夹 26

3.3收集语料的具体操作方法 29

3.3.1从网上直接下载和保存语料 29

3.3.2从PDF文件中读取和保存语料 46

3.3.3将纸版语料转换为电子语料的步骤 47

3.4小结 67

第4章 清理语料 68

4.1手动删除无用的信息 69

4.2使用「正规表現/规则命令句」删除注音假名(ルビ) 71

4.3使用「正规表現/规则命令句」删除文中的各类不需要的符号 76

4.3.1删除各种装饰性符号 76

4.3.2删除多余的文字和符号信息 81

4.3.3删除空格和空行 83

4.4出错时的返工方法 87

4.5小结 91

第5章 制作语料库 93

5.1使用「えだまめ」转换文件的格式 93

5.2使用全文检索软件「ひまわり」制作语料库 98

5.3设定检索条件与检索例句 106

5.3.1「検索文字列」 106

5.3.2「フイルタ」 111

5.3.3「コーパス」 114

5.3.4「検索才プション」 116

5.3.5例句栏上方的10个栏目标题 118

5.4在全文中观察、保存和使用例句 119

5.4.1在全文中观察例句 119

5.4.2保存例句 121

5.4.3展开和使用例句 124

5.5小结 133

第6章 给例句加注标签与日语研究 135

6.1制作标签的思路 136

6.2标签的分类与所需软件 136

6.2.1标签的分类 136

6.2.2加注标签时所使用的软件 137

6.3如何给日语例句加注标签 137

6.3.1加注标签与日语「存在構文」的研究 138

6.3.2加注标签 138

6.3.3制作加注标签的语料库「日本語の存在構文コーパス」 154

6.3.4检索和保存例句以及清除垃圾例句 164

6.3.5对标签进行统计和分析 171

6.4小结 178

参考文献 180

后记 181

返回顶部