《汉字识别 原理.方法与实现》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:吴佑寿,丁晓青著
  • 出 版 社:北京:高等教育出版社
  • 出版年份:1992
  • ISBN:7040036215
  • 页数:248 页
图书介绍:本书包括汉字集合及其属性、模式识别的理论和方法、印刷汉字的单字识别、脱机手写汉字识别和联机手写汉字识别

第一章 绪论 1

1-1 汉字识别与汉字输入 1

1-2 汉字识别的问题与困难 3

1-3 汉字识别系统的构成和识别方法 5

1-4 汉字识别技术的现状与展望 7

参考资料 10

第二章 汉字集合及其属性 12

2-1 引言 12

2-2 笔划与笔段 13

2-2-1 笔划 13

2-2-2 笔段 15

2-3 部件 19

2-3-1 部首 19

2-3-2 字根 20

2-4-1 字型 22

2-4 单字——字型、字体与字号 22

2-4-2 字体 23

2-4-3 字号 27

2-5 汉字字量 28

2-6 汉字的字频与词频 30

2-6-1 字频 31

2-6-2 词频 33

参考资料 37

第三章 模式识别的理论和方法 38

3-1 模式、模式样本和模式识别 38

3-2 模式识别的统一熵理论 40

3-2-1 问题的提出 40

3-2-2 模式识别信息系统中引入的熵定义 41

3-2-3 模式识别的信息系统(或熵系统) 46

3-2-4 学习和识别过程的熵变化 48

3-2-5 决定模式识别性能的信息参量 49

3-2-6 利用统一熵理论指导模式识别系统设计的举例 51

3-3 统计模式判决理论(一)——两类模式分类问题 54

3-3-1 最小误识概率的Bayes判决准则 54

3-3-2 Bayes分类判决的误识概率 58

3-3-3 特征矢量为N维独立随机变量时Bayes判决的误识概率 61

3-4 统计模式判决理论(二)——多类模式分类问题 63

3-4-1 最大后验概率多类分类器 66

3-4-2 距离测度分类器 67

3-4-3 多类分类器误识概率分析 70

3-5 模式识别系统的特征选择和提取 75

3-5-1 特征有效性的信息量度 75

3-5-2 与误识概率界限有关的特征选择准则 78

3-5-3 正态分布特征矢量的选择 81

3-6 树分类器 81

3-6-1 利用统计判决理论设计树分类器 85

3-6-2 树分类器的性能分析 89

参考资料 94

第四章 印刷体汉字的单字识别 96

4-1 引言 96

4-1-1 汉字识别的问题和困难 96

4-1-2 识别方法和识别系统的构成 98

4-2 关于分类特征的一般考虑 99

4-3 模板法 102

4-4 投影-变换系数法 106

4-5 基于统计量的网格特征、外围特征和笔划方向特征 109

4-5-1 基于像素数量的粗网格特征与外围特征 109

4-5-2 基于笔划方向的统计特征 110

4-6 多重相似度法(MSM) 113

4-6-1 笔划复杂性指数(Complexity index) 114

4-6-2 四周面积编码(Surrounding area code) 116

4-6-3 多重相似度(Multiple Similarity Method) 117

4-7 特征点法 121

4-8 结构特征——边框与局部特征 123

4-8-1 选用结构特征的一些考虑 124

4-8-2 提取结构特征的方法 127

4-9 汉字的属性关系图描述 129

4-9-1 汉字的属性关系图描述 130

4-9-2 汉字属性关系图的畸变模型 132

4-9-3 基于汉字ARG描述提取部首特征的方法 134

4-10 汉字的约束-连接图描述 137

4-10-1 以笔段为基元的笔划模型及单字结构描述 137

4-10-2 CCG的距离和协同的松弛迭代算法 139

参考资料 144

第五章 脱机手写汉字识别 146

5-1 引言 146

5-2 手写汉字的特点 147

5-3 几种手写字符样本库简介 151

5-4 识别方法一般介绍 154

5-5 笔划分析-综合法 156

5-6 笔划轮廓的折线近似表示与松弛迭代匹配法 158

5-7 笔划分布特征 166

5-7-1 笔划方向特征(Stroke Direction Contr butivity Density,S-DCD) 166

5-7-2 笔划密度特征(Stroke Density Function,SDF) 168

5-8 背景特征 169

5-9 手写汉字识别的一些其它方法和问题 171

参考资料 173

第六章 联机手写汉字识别 175

6-1 联机手写汉字识别的特点和问题 175

6-1-1 笔划类型变化及其影响 176

6-1-2 笔顺变化及其影响 177

6-2 联机手写汉字识别的预处理 178

6-3 变换系数法 181

6-4 以笔划为基元的识别方法 182

6-4-1 工作原理 183

6-4-2 系统框图和识别过程 186

6-5 以笔段为基元的识别方法 189

6-5-1 汉字结构的层次与基元选择 190

6-5-2 笔段类型与笔段的字形结构排序法 191

6-5-3 字根与单字的描述及启发式匹配算法 193

6-6 本章小结 195

参考资料 197

第七章 单字识别的后处理 199

7-1 问题的提出 199

7-2 对单字识别器输出的要求及其描述 201

7-3 基于Bayes准则的词识别 203

7-4 对拒识字的后处理 206

7-5 利用双字词匹配的后处理 210

7-6 基于句法-语义分析的后处理 213

7-6-1 系绕的构成及其工作过程 213

7-6-2 书面汉语的自动分词 215

7-6-3 利用语义分析的后处理 215

参考资料 218

8-1 引言 219

第八章 实用汉字识别系统 219

8-2 印刷汉字识别系统的构成和总体技术指标 220

8-2-1 汉字识别系统的构成 220

8-2-2 实用印刷汉字识别系统的总体技术指标 221

8-3 汉字识别系统的输入装置 227

8-4 文本的版面分析 231

8-5 汉字的行切割和字切割 234

8-5-1 行切割 234

8-5-2 字切割 235

8-6 汉字的归一化 238

8-6-1 位置归一化 238

8-6-2 大小归一化 240

8-7 汉字识别算法的硬件实现 241

参考资料 244

附录Ⅰ 245

附录Ⅱ 247