上编 汉字的特征分析 3
第一章 汉字的使用 3
1.1 汉字的字量 3
1.2 汉字字集 4
1.2.1 “GB 13000.1字符集” 4
1.2.2 现代汉语常用字表 5
1.2.3 “现代汉语研究语料库系统”汉字 7
1.2.4 小学语文教材汉字 8
1.3 汉字的使用 10
1.3.1 从小学语文教材看汉字的使用 11
1.3.2 从语料库看汉字的使用 14
第二章 汉字字形特征 17
2.1 汉字的笔画 17
2.1.1 汉字的笔形 17
2.1.2 汉字的笔画数 19
2.1.3 汉字笔画趋简率 22
2.2 汉字的基础部件 25
2.2.1 部件的类型 25
2.2.2 基础部件的数量 26
2.2.3 成字部件和非成字部件 30
2.2.4 基础部件的构字能力 33
2.2.5 基础部件的典型位置 35
2.2.6 基础部件的构形 38
2.3 汉字的构造 43
2.3.1 汉字的结构类型 43
2.3.2 汉字的结构层次 51
2.3.3 汉字的构造 56
第三章 汉字形声字声旁表音研究 59
3.1 汉字的构字法 59
3.2 形声字声旁表音的统计研究 61
3.3 小学语文教材形声字表音情况分析 66
3.3.1 小学语文教材形声字数据库的建立 66
3.3.2 小学语文教材形声字数量 68
3.3.3 小学语文教材形声字的使用 70
3.3.4 小学语文教材形声字的家族 72
3.3.5 小学语文教材形声字的表音特点 74
第四章 形声字的认知研究 83
4.1 早期的汉字认知研究 83
4.2 80年代以后的汉字认知研究 84
4.2.1 汉字的构成成分和汉字的正字法规则 85
4.2.2 汉字的亚词汇加工 86
4.2.3 汉字的语音意识 87
4.2.4 儿童发展性阅读障碍 88
4.3 形声字字音加工的认知研究 89
4.3.1 形声字的规则性效应及其发展 89
4.3.2 形声字的一致性效应及其发展 92
下编 汉字的计算与模拟研究 99
第五章 联结主义理论和自组织模型 99
5.1 语言习得理论 99
5.2 联结主义理论 101
5.3 神经网络模型 104
5.3.1 主要的神经网络模型 104
5.3.2 神经网络的学习 105
5.3.3 神经网络中的信息表征 107
5.4 自组织理论 107
5.4.1 自组织模型简介 107
5.4.2 赫布学习法 110
5.5 语言习得的自组织模型 110
5.5.1 DISLEX及其相关研究 112
5.5.2 DevLex及其相关研究 114
5.6 汉字命名的计算机模拟研究 116
5.6.1 模型的结构 117
5.6.2 汉字字形字音的表征 117
5.6.3 模型的模拟结果 119
第六章 汉字表征研究 121
6.1 汉字字形的表征方法 121
6.1.1 前期研究 122
6.1.2 汉字字形表征 125
6.2 汉字字音的表征方法 136
6.3 形声字字形的复合表征 140
第七章 自组织模型的建造 143
7.1 模拟软件DISLEX 143
7.2 汉字表征数据库及表征程序 148
7.2.1 汉字属性数据库 148
7.2.2 基础部件属性数据库 150
第八章 形声字命名的计算机模拟研究 151
8.1 汉字输入、输出词典中字形、字音的储存方式 151
8.1.1 主要术语和参数说明 151
8.1.2 前期研究 153
8.2 形声字命名模拟研究 156
8.2.1 模型命名形声字的策略 156
8.2.2 模型命名形声字的规则性效应及其发展 161
8.2.3 模型命名形声字的一致性效应及其发展 173
8.3 计算机模拟研究的本质特征 177
8.3.1 语言材料库的建设及其在模型中的应用 177
8.3.2 汉字的字形和字音的表征 181
8.3.3 模型的知识获得和知识输出 183
8.3.4 进一步的研究 186
参考文献 189
附录1:《信息处理用GB 13000.1字符集汉字部件规范》中的“基础部件表” 198
附录2:部件视觉属性分组 204
附录3:汉语音素表征方法及赋值表 211
附录4:模型文件样例 213
附录5:五年级模型命名不熟悉形声字测试材料 217
附录6:模型命名形声字的规则性效应及其发展测试材料 218
附录7:模型命名形声字的一致性效应及其发展测试材料 221
后记 223