绪篇 3
第1章 粤方言字词规范研究概况 3
1.1 粤方言字词规范研究综论 3
1.2 粤方言字词工具书的编纂 6
1.2.1 粤方言字典的编纂 6
1.2.2 粤方言词典的编纂 8
第2章 信息处理用粤方言字词规范概论 10
2.1 粤方言字词规范的目的与意义 10
2.1.1 规范粤方言字词的目的 10
2.1.2 规范粤方言字词的意义 11
2.2 粤方言字词规范的主要内容 13
2.2.1 粤方言字的相关规范 13
2.2.2 粤方言词的相关规范 14
2.3 粤方言字词规范的主要原则 15
2.3.1 通用性原则 15
2.3.2 区别性原则 15
2.3.3 系统性原则 16
2.3.4 实用性原则 16
2.3.5 稳定性原则 16
第3章 本书主要术语的内涵与外延 17
3.1 粤方言 17
3.2 粤方言字 17
3.3 粤方言词 18
3.4 粤方言信息处理 18
3.5 粤方言分词和分词单位 19
3.6 汉字编码 19
3.7 粤语拼音方案 21
字篇 25
第4章 粤方言异体字的规范问题 25
4.1 概述 25
4.2 粤方言异体字的成因 26
4.3 粤方言异体字的规范原则和操作方法 27
4.3.1 粤方言异体字的规范原则 27
4.3.2 规范粤方言异体字的操作方法 28
4.4 粤方言异体字规范例析 29
4.4.1 “揿gam6[k?m22]”组异体字 30
4.4.2 “趷gad6[k?t22]”组异体字 30
4.4.3 “晒saai3[sai33]”组异体字 31
4.4.4 “?ji1[i55]”组异体字 31
4.5 结论 32
第5章 粤方言繁简字的规范问题 33
5.1 前言 33
5.2 粤方言繁简字在使用中存在的问题 34
5.3 粤方言繁简字的问题成因及对策 35
5.3.1 受限于电脑字库 35
5.3.2 受历史因素及语言政策影响 36
5.3.3 缺乏相应的规范 36
5.4 粤方言繁体方言字的简化原则与方法 37
5.4.1 简化原则 37
5.4.2 简化方法 38
5.5 结语 39
第6章 粤方言多音字的规范问题 40
6.1 前言 40
6.2 粤方言字多音字的成因 41
6.2.1 由音系变异引起的多音字 41
6.2.2 由发音接近引起的多音异读 41
6.2.3 借用导致的一字多音 42
6.2.4 由词义演变而导致的多音字 43
6.2.5 拟声词中的多音字 43
6.2.6 语气词中的多音字 43
6.2.7 音译词中的多音字 43
6.3 粤方言字多音字的规范原则和方法 44
6.3.1 由音系变异引起的多音字的规范 44
6.3.2 由发音接近引起的多音异读的规范 44
6.3.3 由借用导致的多音字的规范 44
6.3.4 由词义演变导致的多音字的规范 45
6.3.5 拟声词中的多音字的规范 45
6.3.6 语气词中的多音字的规范 45
6.3.7 音译词中的多音字的规范 45
6.4 结论 46
第7章 粤方言的正字和正码问题 47
7.1 引言 47
7.2 《香港增补字符集》的价值与局限 48
7.3 粤方言正字和正码的关系 49
7.3.1 正字和正码的意义 49
7.3.2 正字和正码的顺序问题 50
7.4 粤方言正码和正字的具体方案 51
7.4.1 粤方言正字正码的基本方案 52
7.4.2 粤方言异体字的正字正码 52
7.4.3 粤方言繁简字的正字正码 53
7.5 粤方言正字正码工作对其他方言用字规范工作的借鉴意义 53
7.6 结语 54
词篇 59
第8章 粤方言异形词的规范问题 59
8.1 由字形规范与词形规范说起 59
8.2 粤方言的异形词问题 59
8.3 粤方言异形词的产生原因 60
8.3.1 异体字、繁简字造成的异形词 61
8.3.2 同音假借产生的异形词 61
8.4 粤方言异形词整理原则 62
8.4.1 通用性原则 62
8.4.2 理据性原则 62
8.4.3 规范性原则 63
8.4.4 系统性原则 63
8.5 粤方言异形词的收集和整理 63
8.5.1 异形词的收集 63
8.5.2 异形词的整理方案 64
8.5.3 系列异形词整理例释 64
8.6 结语 67
第9章 信息处理用粤方言词类划分与标注问题 68
9.1 粤方言的词类划分问题 68
9.1.1 时间词、处所词、方位词是否划入名词 70
9.1.2 区别词和状态词是否单立 71
9.1.3 体貌类和结构关系类后附成分的处理 71
9.1.4 助词和语气词之间的关系 73
9.1.5 小结 73
9.2 信息处理用粤方言词类划分及词性标注问题 74
9.2.1 粤方言词类划分及词性标注的原则 74
9.2.2 信息处理用粤方言词类的层级划分及标注 75
第10章 信息处理用粤方言分词标注规范问题 82
10.1 粤方言分词标注规范的总体思路 82
10.2 粤方言分词的切分问题 83
10.2.1 普通名词(n) 83
10.2.2 人名(nr) 83
10.2.3 地名(ns) 84
10.2.4 团体、机构、组织的专有名称(nt) 85
10.2.5 其他专有名词(nz) 85
10.2.6 数词与数量词组(m) 85
10.2.7 时间词(t) 86
10.2.8 单音节代词(r) 87
10.2.9 区别词(b) 87
10.2.10 动词加动词或动词加形容词构成的述补结构 88
10.2.11 四字及四字以上的短语 88
10.2.12 四字熟语(i) 88
10.2.13 五字及五字以上的熟语 88
10.2.14 缩略语(j) 89
10.2.15 语素字和非语素字 89
10.2.16 文本中非汉字的字符串 89
10.2.17 同形异构现象 90
10.3 粤方言重叠式的切分标注问题 90
10.4 粤方言附加结构的切分标注问题 92
第11章 信息处理用粤方言常用词词表 94
11.1 词表排版说明 94
11.2 信息处理用粤方言常用词词表 94
参考文献 261
附录 267
附录1 常见粤方言异体字音形义对照表 267
附录2 常见粤方言多音字表 280
附录3 粤方言字(含异体字)字码对照表 320
附录4 常见粤方言异形词(多音节)音形义对照表 355
附录5 信息处理用粤方言词性标注集 374
后记 377