目录 1
第一章 绪论 1
1.1 汉字与汉字信息处理概念 1
1.1.1 信息与信息处理 1
1.1.2 汉字的基本特征 2
1.1.3 汉字信息处理 3
1.2 汉字信息处理系统 5
1.2.1 汉字信息处理系统的特点和中西文兼容 5
1.2.2 汉字信息处理系统的组成框图 7
1.2.3 汉字输入 7
1.2.4 汉字存储 9
1.2.5 汉字信息的加工处理 10
1.2.6 汉字输出 11
1.3 汉字信息处理技术的发展 12
1.3.1 汉字信息处理技术发展的回顾 12
1.3.2 汉字信息处理的国家标准 14
1.3.3 汉字设备和部件 15
1.3.4 汉字信息处理软件的发展 20
1.3.5 汉字信息处理系统的应用 21
1.3.6 汉字信息处理技术的当前任务 25
1.4 民族语言文字信息处理概述 27
1.4.1 民族文字的特点 27
1.4.2 民族语言文字信息处理发展概况 28
1.4.3 民族语言文字信息处理的国家标准 29
2.1.1 汉字的演变 30
第二章 汉字属性和汉字编码 30
2.1 汉字字符的数量和分级 30
2.1.2 现代汉字的分级 32
2.2 汉字的字形结构 33
2.2.1 位点 33
2.2.2 笔画 34
2.2.3 字根 34
2.2.4 单字 36
2.3 汉字的字音 37
2.3.1 语音的性质 37
2.3.2 汉字的读音 38
2.4 汉字的字义 41
2.5.1 汉字字符的使用频度 42
2.5 汉字字符的频度和排序 42
2.5.2 汉字的排序 45
2.6 汉字编码 48
2.6.1 汉字输入码 49
2.6.2 汉字交换码 49
2.6.3 汉字内部码 55
2.6.4 汉字字形码 59
2.6.5 汉字地址码 59
2.6.6 汉字控制功能码 59
2.6.7 ISO10646,UCS《通用多八位编码字符集》 62
2.7 汉字属性字典 69
2.7.1 汉字属性字典的内容 69
2.7.2 汉字属性系统 70
第三章 词汇处理 72
3.1 语素 72
3.1.1 单音节语素 72
3.1.2 双音节语素和多音节语素 74
3.2 词 74
3.2.1 单音节词、双音节词和多音节词 75
3.2.2 单纯词和合成词 75
3.2.3 同音词、多义词、同义词 76
3.3 词组 78
3.4 词汇处理的基本内容 79
3.5 词频统计和常用词表 79
3.5.1 汉语词频统计 80
3.5.2 常用词词表 81
3.6 词语排序 82
3.7 词库建立 84
3.8 汉语自动分词方法 88
3.8.1 自动分词的基本方法 89
3.8.2 自动分词的歧义及处理 91
第四章 汉字输入 96
4.1 中文字、词、句输入技术的发展 96
4.1.1 单字输入 96
4.1.2 词输入 97
4.1.3 句输入 98
4.2.1 分类 99
4.2 汉字的键盘输入方法 99
4.2.2 整字键盘汉字输入 100
4.2.3 汉字编码输入的分类和发展方向 102
4.2.4 汉字编码输入方案的评测 106
4.3 汉字编码输入方案实例 111
4.3.1 CC-DOS配备的4种基本输入方案 111
4.3.2 五笔字型(WBZX)编码输入法 114
4.3.3 大众码汉字输入技术 121
4.3.4 “三笔法”编码方案 125
4.3.5 TM声数汉字编码方案 128
4.3.6 自然码输入法 129
4.4.1 汉字键盘输入的基本过程 138
4.4 汉字输入支持系统 138
4.4.2 汉字输入代码转换 139
4.4.3 编码输入方法的挂接技术 143
4.5 鼠标器汉字输入 144
4.5.1 VGMPDOS系统结构 145
4.5.2 VGMP非键盘汉字输入技术 146
4.5.3 VGMP非键盘汉字输入方法的主要特点 148
4.6 汉字字形识别输入 149
4.6.1 概述 149
4.6.2 字形检测和预处理 153
4.6.3 联机手写实时汉字识别 156
4.6.4 印刷体汉字识别 161
4.7 汉字语音识别输入 164
5.1.1 分类的基本情况 168
5.1 汉字字形存储的分类 168
第五章 汉字字形存储 168
5.1.2 汉字点阵字形存储 169
5.1.3 笔画组合式字形存储 174
5.1.4 字根组合式存储 178
5.2 字形压缩与还原 181
5.2.1 哈夫曼树压缩法 183
5.2.2 黑白段压缩法与线性增量压缩法 185
5.2.3 笔画轮廓压缩法 187
5.2.4 字形轮廓压缩法 190
5.3 汉字字形变倍处理 193
5.3.2 直接放大法 195
5.3.1 汉字变倍的基本原理 195
5.3.3 齐次坐标法 196
5.3.4 逻辑方程插入法 198
5.3.5 轮廓变倍法 198
5.4 汉字库结构与查找 199
5.4.1 内存型、外存型和内外存结合型汉字库 200
5.4.2 静态字库与动态字库 202
5.4.3 单级与多级字库 205
第六章 汉字I/O设备 209
6.1 汉字显示器 209
6.1.1 基本原理 209
6.1.2 显示控制方式 211
6.1.3 IBM PC图形显示器 213
6.1.4 高分辨率图形显示 217
6.1.5 显示卡 219
6.2 汉字显示终端 221
6.2.1 汉字终端概述 221
6.2.2 汉字显示终端的组成与软件设计 224
6.3 汉字打印机 231
6.3.1 分类 231
6.3.2 针式打印机 232
6.3.3 激光印字机 238
6.3.4 其他汉字印字机 242
6.4 汉卡 243
6.4.1 汉卡的基本功能 243
6.4.2 几种常用汉卡简介 246
第七章 中西文兼容信息处理系统的实现 249
7.1 汉字信息处理系统的配置 250
7.1.1 独立型微机汉字信息处理系统 250
7.1.2 多终端联机汉字信息处理系统 252
7.1.3 网络汉字处理系统 254
7.2 汉字化技术 254
7.2.1 软件汉化的方式和任务 254
7.2.2 汉字的内码表示 256
7.2.3 软件汉化方法 261
7.3 中西文兼容信息处理系统的分级 266
7.3.1 中西文兼容处理概念 266
7.3.2 应用级中西文兼容处理系统 267
7.3.3 系统级中西文兼容处理系统 268
7.3.4 终端级中西文兼容处理系统 270
7.3.5 网络通信中的中西文兼容 272
7.4 IBM大中型机的汉字运行环境 284
7.4.1 用IBM PC汉字仿真终端建立的大中型机汉字运行环境 285
7.4.2 用长城0520CH作仿真终端建立的IBM大中型机汉字运行环境 288
7.5 VAX系列计算机的汉化 295
7.5.1 VAX/VMS的分层结构及汉化的基本思路 296
7.5.2 汉化工作的主要内容 298
7.5.3 汉化工具和汉化试探 300
7.5.4 EDITOR的汉化 305
7.6 CC-DOS汉字操作系统 308
7.6.1 CC-DOS的系统结构 309
7.6.2 CC-BIOS的汉字处理模块 312
7.6.3 系统文件汉字化 320
7.6.4 CC-DOS的自举 321
7.7 UNIX操作系统的汉字化改造 326
7.7.1 UNIX的层次结构 327
7.7.2 汉化方案的主要依据 327
7.7.3 UNIX系统汉化的主要内容 328
7.8 程序设计语言、数据库管理系统和实用软件的汉化 330
7.8.1 系统软接口法 330
7.8.2 预编译法 331
7.8.3 程序修改法 331
第八章 民族文字信息处理 336
8.1 我国民族文字简介 336
8.1.1 我国现行语言文字的使用情况 336
8.1.3 民族文字信息处理的设计思想 337
8.1.2 我国文字的结构类型 337
8.2.1 蒙古文字的特征 338
8.2 蒙古文信息处理 338
8.2.2 蒙古文信息处理设计思想 340
8.2.3 蒙古文信息处理的现状 342
8.3 朝鲜文信息处理 343
8.3.1 朝鲜文字的特征 343
8.3.2 朝鲜文信息处理设计思想 344
8.3.3 朝鲜文信息处理现状 345
8.4 维吾尔文信息处理 346
8.4.1 维、哈、柯文的文字特征 346
8.4.2 维、哈、柯文信息处理设计思想 348
8.5.1 彝文的文字特征 350
8.4.3 维、哈、柯文信息处理现状 350
8.5 彝文信息处理 350
8.5.2 彝文信息处理设计思想 351
8.5.3 彝文信息处理现状 352
8.6 藏文信息处理 352
8.6.1 藏文的文字特征 352
8.6.2 藏文基本字符的选择 353
8.6.3 藏文的编码方案 354
8.6.4 藏文的打印输出 358
8.6.5 藏文信息处理的现状 358
8.7 多文种信息处理系统 359
参考文献 361