第一部分 学习者语料库介绍 1
第一章 绪论 1
1.1 SWECCL 1.0的建设背景 1
1.2 SWECCL 1.0语料库概述 4
1.3 SWECCL 1.0项目组概况 6
1.4 SWECCL 1.0的安装 7
1.5 学习者语料库的研究方法 9
第二章 SECCL 1.0的设计与建立 11
2.1 SECCL 1.0的建库程序 11
2.2 语料的来源 12
2.3 样本的选择 15
2.4 转录与转写 17
2.5 规模与结构 19
2.6 文本头部信息 22
2.7 口语特征标注 25
2.8 部分语法错误标注 26
2.9 词性赋码 27
2.10 小型专题研究语料 30
第三章 WECCL 1.0的设计与建立 31
3.1 WECCL 1.0的建库程序 31
3.2 样本的选择 33
3.3 样本的采集和录入 34
3.4 语料库的规模和结构 34
3.5 样本的标注 36
3.6 词性赋码 39
第二部分 SWECCL 1.0的工具简介 43
第四章 使用Colligator进行类联接分析 43
4.1 类联接及Colligator的开发背景 43
4.2 Colligator的运行环境及Colligator使用前的准备 44
4.3 Colligator的使用方法 45
4.3.1 Colligator的主界面 45
4.3.2 Colligator的操作方法 46
4.4 Colligator的分析结果及其保存 51
4.5 Colligator的局限 55
第五章 文本特征分析工具PatCount的应用 56
5.1 引言 56
5.2 PatCount的主要功能 56
5.2.1 PatCount的主界面及其对正则表达式的支持 57
5.2.2 PatCount与词汇分析工具Range的比较 59
5.2.3 PatCount的设定 62
5.3 PatCount在学习者语料库研究中的应用 66
5.3.1 文本特征提取及文本特征定量分析 66
5.3.2 学习者语言错误分析 67
参考文献 70
附录一 1996—2002年全国英语专业四级口试试题 72
附录二 WECCL 1.0命题作文题目 84
附录三 用于专题研究的小型口语语料说明 89
附录四 CLAWS4词性赋码集 94
图表 6
图 6
1.图1.1 SWECCL 1.0语料库的总体设计结构 6
2.图3.1 WECCL 1.0作文语料收集流程 32
3.图4.1 安装Microsoft.NET 44
4.图4.2 Colligator的主界面 46
5.图4.3 选择文本 47
6.图4.4 检索模式:词 48
7.图4.5 检索模式:码 48
8.图4.6 检索模式:词 48
9.图4.7 正则表达式检索 48
10.图4.8 复杂的正则表达式检索 49
11.图4.9 设定跨距(学习者语料) 50
12.图4.10 设定跨距(本族语者) 51
13.图4.11 数据呈现(Word模式) 52
14.图4.12 数据呈现(TAG模式) 53
15.图4.13 数据呈现(Word_TAG模式) 53
16.图4.14 将分析结果粘贴到Microsoft Word中 54
17.图5.1 PatCount的主界面 58
18.图5.2 PatCount对文本中短语的统计 61
19.图5.3 以Excel格式保存的分析结果(比率方式呈现) 62
20.图5.4 选择本义字符串方式读入模式文件 63
21.图5.5 本义字符串转换成正则表达式 63
22.图5.6 本义字符串转换成正则表达式 64
23.图5.7 将转置后的矩阵粘贴到统计软件中 65
24.图5.8 “人称代词+情态动词”序列的模式文件 66
25.图5.9 PatCount对定性研究数据的量化处理 68
表 3
1.表1.1 国内外主要的英语学习者语料库 3
2.表1.2 学习者语料研究的多种比较 9
3.表2.1 全国英语专业四级口试评分标准 14
4.表2.2 对SECCL 1.0样本选择的描述 17
5.表2.3 SECCL 1.0数码语音文件描述 18
6.表2.4 SECCL 1.0的语音库的规模与结构 19
7.表2.5 语音转写文本库结构及容量 21
8.表2.6 SECCL 1.0语料库标注符号一览表 23
9.表3.1 WECCL 1.0的结构与容量 35
10.表3.2 WECCL 1.0语料库标记一览表 37