第一章 绪论 1
一、撰写目的 1
二、适用对象 2
三、写作特点 3
第二章 词汇计量研究的语言观 5
一、语言研究的归纳派与演绎派 6
(一)任何一种语言研究都有自己的哲学观基础 6
(二)计量研究属于归纳派 7
(三)计量研究与定性研究的关系 9
二、汉语计量研究观的形成 12
(一)“例不十,不立法”时期 12
(二)专书研究时期 15
(三)语料库研究时期 18
三、研究特点 22
(一)词汇特点 22
(二)词汇计量研究特点 26
四、研究中要注意的若干问题 28
(一)选材要有代表性、准确性、封闭性 28
(二)特征标注的多角度与周遍性 30
(三)寻求最有效的分析方法和理论 31
思考与练习 32
第三章 汉语词汇计量研究的发展 35
一、语料库介绍 35
(一)什么是语料库 36
(二)语料库的分类 36
(三)语料库的作用 40
二、《现代汉语频率词典》的词汇计量研究 42
(一)语料来源 43
(二)基本内容 44
(三)研究方法 45
三、《现代汉语词典》的词汇计量研究 49
(一)语料性质 49
(二)词汇理论研究的内在需求 50
(三)语料库的建立 52
(四)研究专题 54
四、词表研制 58
(一)词表与正式词表 58
(二)11种词表介绍 61
(三)词表的分类 75
(四)词表的研制方法 76
(五)语料选取与分词对词表研制的影响 78
思考与练习 79
第四章 词汇计量功能实现的手段与工具 81
一、语料管理与数据分析 81
(一)语料的储存与管理 81
(二)数据的统计与分析 82
(三)本书练习库介绍 83
二、Microsoft Access关系型数据库 86
(一)Microsoft Access的特点 86
(二)“表”的界面 88
(三)“查询”的界面 93
(四)“窗体”的界面 104
(五)表达式与函数的运用 107
(六)表的关联 109
(七)表的复制与合并 112
三、SQL——数据库管理语言 113
(一)SQL简介 113
(二)SELECT语句——查询数据 115
(三)INSERT语句的使用——插入数据 123
(四)UPDATE语句的使用——更新数据 125
(五)DELETE语句的使用——删除数据 126
四、Excel——电算软件 127
(一)Excel简介 127
(二)计算功能 128
(三)文字处理功能 131
(四)图表加工功能 134
(五)数据统计分析功能 134
(六)函数的运用 136
思考与练习 137
第五章 如何建词语库 139
一、建库的七种方法 139
二、如何为语料选择合适的“行”与“列” 142
三、“主键”的使用 145
四、保护功能的设置 147
五、“说明”栏的功能 149
六、提示功能的设置 150
七、单表与多表的选用 151
思考与练习 155
第六章 如何整理词语库 157
一、数据类型的调整 157
二、删除空格 159
三、删除词条 160
四、修改词条内容 161
五、在字段原值前后增加或减少内容 164
六、把不同字段的词语、注音、释义合并到一个字段 165
七、把一个字段的词目、注音、释义分拆成几个字段 167
八、在多行相同字段内容中删去首行以外的重复者 169
九、给词语表新增排序号 174
十、把一行记录中的并列同义词变成“一对多”的同义词组 176
思考与练习 179
第七章 如何描写词语状况 183
一、查词的数量 183
二、查词语的长度 185
三、查释义的用字情况 187
四、查词的义项数 191
五、合计词的频次 195
六、查同素词 196
七、查反序词 199
八、查同形词 206
思考与练习 211
第八章 如何计算表内数字性数据 213
一、同一字段内的数字运算 214
(一)函数的运用 215
(二)限定范围的运算 219
二、同一记录内的数字运算 221
(一)函数的运用 221
(二)限定范围的运算 226
思考与练习 229
第九章 词语库内容的导入与导出 231
一、导入到词语库 231
(一)如何从表格文件中导入语料 231
(二)如何把文本文件的语料导入形成行与列的关系 232
(三)如何从Word文件中导人语料 241
(四)如何为语料选择合适的字段格式 242
二、从词语库导出 244
(一)导出的渠道和手段 244
(二)如何消除数据库格式 246
思考与练习 247
第十章 如何分词与抽词 249
一、切分词语对词语统计的影响 249
(一)词语切分的讨论 250
(二)切分结果对词语统计的影响 251
(三)词语性质对词语统计的影响 252
二、如何利用Word的自带功能来切分字与词 255
(一)对文字的处理 255
(二)对数字的处理 257
(三)对句子的处理 258
(四)如何消除文本中的硬回车 261
三、如何从大批量词语中抽取样词 263
(一)随机抽样方法的选用 263
(二)针对词语库不同属性的随机抽取 270
思考与练习 271
第十一章 如何在两个词语表之间建立关系与对比 273
一、建立一对一、一对多的关系表 273
(一)起简化、拓展作用的标注表 273
(二)起串联相关主题表作用的关系库 278
二、比较两个词语表的异同 281
(一)先建词种表 282
(二)用关联表的方式调取两表相同的词语 283
(三)用关联表的方式调取甲表有乙表无的词语 283
(四)用关联表的方式调取甲表无乙表有的词语 284
(五)用合并表的方式查两表的同异 285
三、在窗体中显示一对多的标注表与词语表 289
思考与练习 290
第十二章 如何对词语差异进行测算 291
一、频次与频率的计算 291
(一)什么是频次与频率 291
(二)频率的作用 293
二、文本数与分布率的计算 294
(一)什么是文本数与分布率 294
(二)分布率的作用 297
三、累加覆盖率的计算 299
(一)什么是累加覆盖率 299
(二)累加覆盖率的作用 302
四、使用度的计算 307
(一)什么是使用度 307
(二)使用度的作用 307
五、频率差的运用 312
(一)什么是频率差 312
(二)频率差的作用 319
六、频级的运用 320
(一)什么是频级 320
(二)频级的作用 325
思考与练习 332
第十三章 如何对词语分布态进行分析 333
一、词语分布的均数、众数与中位数 333
(一)什么是均数、众数、中位数 333
(二)均数、众数、中位数的作用 336
二、词语分布的“四分位数”与“数组排位” 340
(一)什么是“四分位数”和“数组排位” 340
(二)“四分位数”与“数组排位”的作用 340
三、词语演变的走势图 343
(一)折线图与变化趋势 343
(二)用折线图来筛选异形词 343
四、词语集之间的相关分析 346
(一)什么是相关分析 346
(二)词语集之间的词长比较 347
(三)标准差与方差的计算 348
思考与练习 353
第十四章 专题综合练习 355
一、专书词汇统计 355
(一)分词入库 355
(二)导入数据库 356
(三)词种统计 356
(四)累加覆盖率统计 358
(五)词长统计 360
二、多书之间词语集的对比分析(以历史、地理教材为例) 361
(一)共用词、独用词的统计 361
(二)分表频率、合表频率计算 362
(三)频率差比较 362
三、语义分类库的义类统计 363
(一)义类统计 363
(二)更新类名 364
(三)义类排序 365
参考文献 367
术语表 373
后记 379