第一章 绪论 1
1-1 汉字识别与汉字输入 1
1-2 汉字识别的问题与困难 3
1-3 汉字识别系统的构成和识别方法 5
1-4 汉字识别技术的现状与展望 7
参考资料 10
第二章 汉字集合及其属性 12
2-1 引言 12
2-2 笔划与笔段 13
2-2-1 笔划 13
2-2-2 笔段 15
2-3 部件 19
2-3-1 部首 19
2-3-2 字根 20
2-4-1 字型 22
2-4 单字——字型、字体与字号 22
2-4-2 字体 23
2-4-3 字号 27
2-5 汉字字量 28
2-6 汉字的字频与词频 30
2-6-1 字频 31
2-6-2 词频 33
参考资料 37
第三章 模式识别的理论和方法 38
3-1 模式、模式样本和模式识别 38
3-2 模式识别的统一熵理论 40
3-2-1 问题的提出 40
3-2-2 模式识别信息系统中引入的熵定义 41
3-2-3 模式识别的信息系统(或熵系统) 46
3-2-4 学习和识别过程的熵变化 48
3-2-5 决定模式识别性能的信息参量 49
3-2-6 利用统一熵理论指导模式识别系统设计的举例 51
3-3 统计模式判决理论(一)——两类模式分类问题 54
3-3-1 最小误识概率的Bayes判决准则 54
3-3-2 Bayes分类判决的误识概率 58
3-3-3 特征矢量为N维独立随机变量时Bayes判决的误识概率 61
3-4 统计模式判决理论(二)——多类模式分类问题 63
3-4-1 最大后验概率多类分类器 66
3-4-2 距离测度分类器 67
3-4-3 多类分类器误识概率分析 70
3-5 模式识别系统的特征选择和提取 75
3-5-1 特征有效性的信息量度 75
3-5-2 与误识概率界限有关的特征选择准则 78
3-5-3 正态分布特征矢量的选择 81
3-6 树分类器 81
3-6-1 利用统计判决理论设计树分类器 85
3-6-2 树分类器的性能分析 89
参考资料 94
第四章 印刷体汉字的单字识别 96
4-1 引言 96
4-1-1 汉字识别的问题和困难 96
4-1-2 识别方法和识别系统的构成 98
4-2 关于分类特征的一般考虑 99
4-3 模板法 102
4-4 投影-变换系数法 106
4-5 基于统计量的网格特征、外围特征和笔划方向特征 109
4-5-1 基于像素数量的粗网格特征与外围特征 109
4-5-2 基于笔划方向的统计特征 110
4-6 多重相似度法(MSM) 113
4-6-1 笔划复杂性指数(Complexity index) 114
4-6-2 四周面积编码(Surrounding area code) 116
4-6-3 多重相似度(Multiple Similarity Method) 117
4-7 特征点法 121
4-8 结构特征——边框与局部特征 123
4-8-1 选用结构特征的一些考虑 124
4-8-2 提取结构特征的方法 127
4-9 汉字的属性关系图描述 129
4-9-1 汉字的属性关系图描述 130
4-9-2 汉字属性关系图的畸变模型 132
4-9-3 基于汉字ARG描述提取部首特征的方法 134
4-10 汉字的约束-连接图描述 137
4-10-1 以笔段为基元的笔划模型及单字结构描述 137
4-10-2 CCG的距离和协同的松弛迭代算法 139
参考资料 144
第五章 脱机手写汉字识别 146
5-1 引言 146
5-2 手写汉字的特点 147
5-3 几种手写字符样本库简介 151
5-4 识别方法一般介绍 154
5-5 笔划分析-综合法 156
5-6 笔划轮廓的折线近似表示与松弛迭代匹配法 158
5-7 笔划分布特征 166
5-7-1 笔划方向特征(Stroke Direction Contr butivity Density,S-DCD) 166
5-7-2 笔划密度特征(Stroke Density Function,SDF) 168
5-8 背景特征 169
5-9 手写汉字识别的一些其它方法和问题 171
参考资料 173
第六章 联机手写汉字识别 175
6-1 联机手写汉字识别的特点和问题 175
6-1-1 笔划类型变化及其影响 176
6-1-2 笔顺变化及其影响 177
6-2 联机手写汉字识别的预处理 178
6-3 变换系数法 181
6-4 以笔划为基元的识别方法 182
6-4-1 工作原理 183
6-4-2 系统框图和识别过程 186
6-5 以笔段为基元的识别方法 189
6-5-1 汉字结构的层次与基元选择 190
6-5-2 笔段类型与笔段的字形结构排序法 191
6-5-3 字根与单字的描述及启发式匹配算法 193
6-6 本章小结 195
参考资料 197
第七章 单字识别的后处理 199
7-1 问题的提出 199
7-2 对单字识别器输出的要求及其描述 201
7-3 基于Bayes准则的词识别 203
7-4 对拒识字的后处理 206
7-5 利用双字词匹配的后处理 210
7-6 基于句法-语义分析的后处理 213
7-6-1 系绕的构成及其工作过程 213
7-6-2 书面汉语的自动分词 215
7-6-3 利用语义分析的后处理 215
参考资料 218
8-1 引言 219
第八章 实用汉字识别系统 219
8-2 印刷汉字识别系统的构成和总体技术指标 220
8-2-1 汉字识别系统的构成 220
8-2-2 实用印刷汉字识别系统的总体技术指标 221
8-3 汉字识别系统的输入装置 227
8-4 文本的版面分析 231
8-5 汉字的行切割和字切割 234
8-5-1 行切割 234
8-5-2 字切割 235
8-6 汉字的归一化 238
8-6-1 位置归一化 238
8-6-2 大小归一化 240
8-7 汉字识别算法的硬件实现 241
参考资料 244
附录Ⅰ 245
附录Ⅱ 247