第一章 绪论 4
1·1 中文信息的输入 4
1·2 中文信息的存贮 4
目录 4
1·3 中文信息的输出 5
1·4 中文信息处理系统 5
1·5 中文自然语言处理 5
参考文献 8
2·1·1 语音方面的主要特点 9
第二章 现代汉语基础 9
2·1 现代汉语的特点 9
2·1·2 词汇方面的主要特点 10
2·1·3 语法方面的主要特点 10
2·1·4 现代汉语三要素 10
2·2 汉字的形成、特点和结构 11
2·2·1 汉字是表意文字 11
2·2·4 汉字的结构系统 12
2·2·2 汉字是代表音节的 12
2·2·3 用汉字记录汉语是不实行连写法的 12
2·2·5 汉字的造字方法 15
2·2·6 汉字的书写顺序 17
2·3 语音 18
2·3·1 语音的性质 18
2·3·2 汉语拼音方案 19
2·3·3 汉字的字音 21
2·4 词汇 21
2·4·1 词与词素的区别 22
2·4·2 词组 23
2·4·3 同音词 23
2·4·4 词典与字典 23
参考文献 27
第三章 汉字输入编码 29
3·1 汉字一维熵的统计推断 29
3·1·1 汉字熵的概率分布 30
3·1·2 对汉字熵的均值、方差的推断 31
3·1·3 资料处理 33
3·1·4 汉字熵的概念浅析 34
3·2 海曼公式及其推广与汉字编码时间 36
3·3 汉字编码和排列法的心理学性质及其应用 37
3·3·1 字形编码心理依据 37
3·3·2 汉字排列法心理学性质 38
3·3·3 从心理学角度要求一种汉字编码方案的特点 39
3·4 多作业对击键操作的影响 40
3·5 汉字部件的分析方法和理论 41
3·5·1 现有汉字部件拼合汉字各种方法的差异 41
3·5·2 汉字部件分析的理论基础 41
3·5·3 汉字部件分析基本方法 44
3·6 汉字基本笔画编码法 46
3·6·1 原理 46
3·6·2 基本笔画键盘设计 47
3·6·3 键的位置 49
3·7 WBZX汉字编码方案 50
3·7·1 设计思想 50
3·7·2 汉字的五种笔画代号 51
3·7·3 汉字的基本字型代号 51
3·7·4 汉字的字根 51
3·7·5 汉字的末笔字型交叉识别 51
3·7·6 基本字根拆分原则 51
3·7·7 字根键盘图 52
3·7·8 编码规则 53
3·8 字元编码法 55
3·8·1 编码规则 56
3·8·2 编码举例 56
3·9 汉字宏观字形简易输入法(钱码) 58
3·10 汉字树形结构中文字母编码法 60
3·10·1 汉字结构剖析 60
3·10·4 “树”法 63
3·10·3 汉字结构文法 63
3·10·2 中文字母 63
3·11 汉语拼音方案输入法 64
3·11·1 汉语拼音方案是汉字拼音化的基础 64
3·11·2 声韵调是汉字拼音化的要素 64
3·11·3 同音字和同音词 65
3·12 汉语普通话新文字电脑Ⅱ型 66
3·12·1 标调法 66
3·12·2 构词法,联词法 67
3·13·1 总则 70
3·13 CZ—2汉语词字二元编码方案 70
3·13·2 词组声形编码法 71
3·13·3 单字声形编码法 74
3·13·4 二元编码输入 77
3·14 汉字输入编码系列 79
3·15 拼音中文 81
3·16 拼音拼写文字 82
3·17·2 汉字字音的联想 84
3·17 汉字的联想输入方法 84
3·17·1 汉字字型的联想 84
3·17·3 汉字字义的联想 85
3·17·4 根据构词联想 85
3·17·5 音词联想输入法 85
3·18 计算机辅助编码 87
3·18·1 汉字编码模式 87
3·18·2 汉字计算机辅助编码设计步骤 89
3·18.3 综合调整设计方法 90
3·19 汉字输入方法简易评比法 92
3·20 汉字键盘输入方法评测试行规则(草案) 93
3·20·1 引言 93
3·20·2 总则 94
3·20·3 定量测试 95
3·20·4 定性评估 97
3·20·5 初选 97
3·20·6 动态测试综合评价 98
3·20·7 评测细则 99
3·21 1984年上海市汉字输入编码评测 102
3·22 1983年台湾省汉字输入编码评测 108
参考文献 111
第四章 中文字形库 113
4·1 汉字字形库的基本要求 113
4·2 汉字字形库体系 114
4·2·1 字母式 114
4·2·2 数字式 115
4·3 汉字字形设计 117
4·3·1 点阵字形设计流程图 117
4·3·2 点阵字稿的技术处理 117
4·3·3 标准点阵字形 123
4·3·4 汉字的字模确定 123
4·3·5 字模数据的表示形式 126
4·4·1 汉字规则笔画与不规则笔画的压缩表示 127
4·4 高分辨率汉字字形的压缩和表示 127
4·4·2 字形点阵的复原步骤 129
4·4·3 把一个向量转换成最近似的阶梯点的算法 129
4·4·4 在向量经过的阶梯点上写入二位标记的原则 130
4·4·5 把标记点阵转换成最终输出点阵的方法 132
4·4·6 汉字字形信息压缩性能指标 132
4·4·7 汉字扫描信息的线性增量压缩方法 133
4·5·1 印刷用汉字的字号及其大小比例关系 135
4·5 高分辨率汉字字形的放大和缩小技术 135
4·5·2 文字变倍的基本原理和防止失真的措施 136
4·5·3 用PROM部件来实现变倍计算 138
4·6 计算机汉字字形设计系统 139
4·6·1 LCCD汉字字形设计系统 139
4·6·2 汉字图形信息的冗余度分析及其压缩 140
4·7 汉字字形数据压缩 146
4·7·1 汉字字形的特性 146
4·7·2 二维预测编码 147
4·7·3 用m×n子矩阵信息法编码 148
4·7·4 方格取样近似法 149
4·7·5 笔画法 150
4·7·6 由字元结构合成汉字字符 152
4·7·7 轮廓编码法 154
4·7·8 字符图形的缩放 156
4·8 一种汉字字形的笔画压缩法 157
4·8·1 汉字字形的形式定义 157
4·8·2 压缩汉字库的进一步考虑 161
4·8·3 汉字字形的放大和缩小 162
4·9·1 基本原理 164
4·9 用哈夫曼树方法实现汉字字形库的压缩 164
4·9·2 主要算法 167
4·10 嵌套结构汉字字形库的压缩 172
4·11 点阵字形的矩阵元素数的变换 176
4·11·1 变换法 176
4·11·2 整形判别条件及修正量△的计算 177
4·12·3 字库信息交换设计技术 179
4·12·2 字库拼形原理 179
4·12·1 字库拼形原则 179
4·12 汉字拼形字库的设计 179
4·13 汉字字库结构 180
4·13·1 软盘式汉字字库结构 180
4·13·2 混合式汉字字库结构 181
4·13·3 半导体式汉字字库 183
4·13·4 系统汉字字库配置 185
4·13·5 共用汉字库 185
4·13·6 造字软件设计思想 190
4·14 MASK ROM汉字库设计 191
4·14·1 汉字库使用环境 191
4·14·2 汉字点阵数据存放格式 192
4·14·3 256K位ROM设计 192
4·14·4 1M位ROM设计 202
4·14·5 以国标交换码作为字库地址码的MASK ROM芯片设计 204
4·14·6 256K位ROM芯片汉卡设计举例 208
4·14·7 1M位ROM芯片汉卡设计举例 212
参考文献 214
第五章 汉字信息检索 218
5·1 数据基本存取方式 218
5·1·1 顺序文件 218
5·1·2 散列函数法 225
5·1·3 索引结构 239
5·1·4 查找 245
5·2 动态常用字库查找替换法 249
5·2·1 单键法 250
5·2·2 堆栈法 250
5·2·3 近似LRV法 251
5·2·4 变形堆栈法 252
5·3 通用汉字输入编码转换模块 255
5·3·1 数据库方式 255
5·3·2 字典生成方式 256
5·4 通用汉字输入模块 257
5·4·1 字典数据结构及通用字典生成程序 259
5·4·2 通用汉字输入模块功能特点 264
5·4·3 源字典构成 265
5·5 汉字拼音输入编码压缩技术 268
参考文献 273
第六章 中文信息处理操作系统 275
6·1 中文信息处理系统代码系列 275
6·1·1 七位代码系列 276
6·1·2 八位代码系列 278
6·1·3 双八位代码系列 280
6·2 中文信息处理系统的内部处理代码 283
6·2·1 七位代码系列下的汉字内部处理的格式 284
6·2·2 EBCDIC代码系列下的汉字内部处理码格式 291
6·2·3 带引导符的汉字内部处理码 291
6·2·4 少数民族文字处理代码 291
6·3 CC—DOS操作系统简介 292
6·3·1 CC—DOS概述 292
6·3·2 CC—DOS系统的汉字内码 294
6·3·3 CC—DOS的工作区 295
6·3·4 键盘管理模块 296
6·3·5 打印机管理模块 302
6·3·6 显示管理模块 305
6·3·7 字库管理模块 312
6·4 ZX—DOS操作系统设计 312
6·4·1 ZX—DOS的运行环境 314
6·4·2 ZX—DOS的构成 314
6·4·3 ZX—DOS汉字系统的启动方法 314
6·4·4 汉字输入编码加载方法 315
6·4·5 汉字系统使用的控制键 315
6·4·6 汉字输入控制键 315
6·4·7 汉字的输入方法 317
6·4·8 打印参数的控制方法 317
6·4·9 ZX—DOS的用户程序接口 319
6·5 VNIX汉字处理技术 321
参考文献 324
第七章 中文信息处理程序设计语言 326
7·1 中文处理COBOL语言 326
7·1·1 基本设计思想 327
7·1·2 中文处理COBOL源程序的结构设计 328
7·1·3 中文处理COBOL源程序转换处理 335
7·1·4 中文处理COBOL设计方法 341
7·2 中文处理BASIC语言设计举例 344
7·2·1 设计原理 344
7·2·2 字串处理 345
7·2·3 字串存贮结构分析 348
7·2·4 中文化BASIC语言的形式定义 350
7·3 FORTRAN语言处理中文信息能力 357
7·4 汉字处理FORTRAN语言设计举例 362
7·4·1 设计思想 362
7·4·2 设计过程 362
参考文献 365
8·1·3 关系模型 368
8·1·2 网状模型 368
第八章 中文数据库 368
8·1·1 层次模型 368
8·1 数据模型 368
8·2 关系代数 369
8·2·1 经典集合运算 369
8·2·2 专用关系运算 371
8·3 中文数据库系统的特点 373
8·3·1 中西文兼容数据语言 373
8·3·2 汉字的分类和排序 374
8·3·3 汉字属性字典 377
8·3·4 汉字属性字典软件系统 378
8·3·5 汉字报表输出 382
8·4 汉字关系数据库管理系统RDBMS—1 384
8·4·1 用户接口语言 385
8·4·2 系统结构 388
8·4·3 数据独立性 392
8·4·4 空间管理与物理存取 394
8·4·5 安全性和保密性 395
8·5 CP/M操作系统上的关系数据库系统 398
8·5·1 数据的压缩技术 398
8·5·2 数据类型和表示方法 398
8·5·3 索引和B+树 400
8·5·4 缓冲区技术 400
8·5·5 对DBMS的基本操作 400
8·6 数据压缩技术 401
8·6·1 一种消除字符串装配间隙的压缩方法 401
8·6·2 一种数据压缩技术 406
8·7 中西文兼容dBASE—Ⅱ 408
8·7·1 dBASE—Ⅱ数据库的结构 408
8·7·2 dBASE—Ⅱ数据库管理系统 409
8·7·3 dBASE—Ⅱ命令中的表达式 410
8·7·4 中西文兼容dBASE—Ⅱ系统 411
参考文献 415