《文字识别 原理、方法和实践》PDF下载

  • 购买积分:18 如何计算积分?
  • 作  者:丁晓青,王言伟等著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2017
  • ISBN:9787302454625
  • 页数:618 页
图书介绍:文字是信息的集中载体,文字识别是将文字图像自动输入计算机进行信息化处的重要手段,在全球大数据信息化的今天,具有特殊重要意义。本书基于信息熵理论全面、系统和深入地分析介绍了汉字、覆盖各类文种的民族文字识别的理论、解决和实现复杂多变的多文种文字和文档识别中关键问题的有效算法,和文字文档识别的具体实践,内容主要来源于研究组研究工作总结。全书共分十一章。

第1章 绪论 1

1.1引言 1

1.2文字和汉字 2

1.2.1文字的代码表示 3

1.2.2汉字的字体字形 4

1.2.3汉字的特点 6

1.2.4中文信息处理 8

1.3文字识别和汉字识别 8

1.4文字识别研究历程 10

1.5文字识别分类 11

1.5.1按照不同文种文字和文档的识别技术分类 11

1.5.2按照获取图像方式和识别对象不同分类 12

1.5.3单个字符识别和文档篇章识别 14

1.6文字识别与笔迹鉴别 15

1.7汉字识别的基本方法——基于视觉感知的汉字识别方法 16

1.8关于本书 20

参考文献 21

第2章 模式识别和模式识别信息熵理论 23

2.1引言:模式与模式识别 23

2.2基于贝叶斯统计决策的模式识别 26

2.3模式识别统一信息熵理论 30

2.3.1特征和类别及其相关信息熵 31

2.3.2后验熵:最优贝叶斯分类器误识率的上限 36

2.3.3模式识别的学习与识别信息过程 38

2.3.4互信息:决定模式识别性能的鉴别熵 40

2.4正态分布条件下的模式识别信息熵系统 41

2.5最大互信息鉴别分析(互信息鉴别子空间模式识别) 45

2.5.1最大互信息子空间线性鉴别分析方法 45

2.5.2最大互信息线性鉴别分析与线性鉴别分析LDA 46

2.6特征选择的信息熵准则 47

2.6.1基于错误概率的类别可分性准则 47

2.6.2基于有效互信息的类别可分性准则 48

2.7从信息熵分析看提高识别性能的途径 50

2.8汉字集合和汉字文本的信息熵 52

2.8.1汉字集合的信息熵 52

2.8.2汉字文本的信息熵和汉字的极限熵 53

2.9本章小结 55

参考文献 56

第3章 汉字识别的特征提取 59

3.1引言 59

3.2汉字字符图像规一化预处理 60

3.2.1线性规一化 61

3.2.2非线性规一化 65

3.2.3基于整体密度均衡的非线性规一化 66

3.3汉字识别中的特征抽取 68

3.3.1结构特征 69

3.3.2统计特征 70

3.4汉字识别特征提取研究的发展历程 74

3.4.1基于图像变换的印刷汉字识别特征和系统 74

3.4.2基于形态学汉字结构分析的两级印刷汉字识别特征和系统 74

3.4.3汉字笔画密度微结构全局特征及多字体汉字识别系统 75

3.4.4基于汉字笔画方向网格特征的鲁棒汉字识别系统 77

3.5笔画方向线素特征 80

3.5.1方向线素特征的形成方法 80

3.5.2网格化方向线素特征 82

3.5.3对原模糊分块方法的改进——低通采样方向线素特征 86

3.5.4实验和结果 86

3.6基于Gabor滤波器的高性能汉字识别方向特征 88

3.6.1 Gabor变换理论分析 88

3.6.2适用于汉字识别的Gabor滤波器组设计及实验验证 91

3.6.3对Gabor滤波器组输出的非线性变换 94

3.6.4分块特征的抽取 96

3.6.5实验及结果 97

3.7汉字识别梯度方向特征抽取方法 100

3.7.1梯度方向特征 100

3.7.2梯度方向特征的快速算法 101

3.8不同笔画方向特征的识别性能实验比较 102

3.9本章小结 104

参考文献 104

第4章 特征的鉴别分析和分布整形 109

4.1引言 109

4.2线性鉴别分析 110

4.2.1优化准则 110

4.2.2变换形式和最优解 110

4.2.3变换的分解形式 111

4.2.4启发式讨论 113

4.2.5实验与结果 115

4.2.6小结 118

4.3正则化线性鉴别分析 118

4.3.1小样本带来的问题 118

4.3.2利用正则化估计协方差阵 119

4.3.3实验结果 121

4.4异方差鉴别分析 123

4.4.1基于极大似然估计的异方差线性鉴别分析 124

4.4.2基于Chernoff准则的异方差线性鉴别分析 127

4.4.3基于Mahalanobis准则的异方差线性鉴别分析 129

4.4.4实验结果 130

4.4.5小结 133

4.5特征统计分布整形变换 134

4.5.1特征分布的整形 134

4.5.2正态性检验 135

4.5.3 Box-Cox变换 137

4.5.4方向线素及梯度特征的整形 140

4.5.5实验与结果 142

4.6本章小结 145

参考文献 145

第5章 模式识别分类器设计/统计模式分类方法 148

5.1引言 148

5.2贝叶斯判决理论 150

5.3正态分布下的贝叶斯分类器 152

5.3.1正态分类模型 152

5.3.2最小距离分类器MDC 154

5.3.3线性距离分类器LDC 155

5.3.4二次鉴别函数分类器QDF 156

5.3.5二次鉴别函数 157

5.3.6 QDF误差分析 158

5.4改进二次鉴别函数分类器MQDF 159

5.4.1修正二次鉴别分类MQDF 159

5.4.2 QDF修正形式的贝叶斯估计推导 160

5.4.3实验与结果 163

5.5系统实现与应用 164

5.5.1非限定脱机手写汉字识别系统 165

5.5.2多字体印刷中、日、韩文识别系统 169

5.6分类器的置信度分析 172

5.6.1分类器的置信度和广义置信度 172

5.6.2基于距离的分类器的广义置信度估计 175

5.6.3多层前向神经网络分类器广义置信度估计 180

5.6.4从广义置信度求置信度的方法 181

5.6.5使用ACT估计后验概率 181

5.6.6置信度分析在字符识别中的应用 182

5.6.7小结 187

5.7分类器集成 187

5.7.1集成的3个层次 187

5.7.2基于线性回归的多分类器集成 190

5.7.3利用线性回归提高后验概率估计的准确性 191

5.7.4后验概率的估计误差与误识率的关系 193

5.7.5实验结果 194

5.7.6小结 198

5.8本章小结 198

参考文献 199

第6章 无约束手写汉字识别分类器鉴别学习 202

6.1引言 202

6.2基于最小错误率的鉴别学习 204

6.2.1最小错误率学习 204

6.2.2基于MCE的多模板距离分类器参数鉴别学习 208

6.2.3基于MCE的MQDF分类器参数鉴别学习 210

6.2.4基于MCE的正交混合高斯模型的鉴别学习 212

6.3基于启发式的鉴别学习方法 222

6.3.1矫正学习 222

6.3.2镜像学习方法 232

6.3.3样本重要性加权学习方法 235

6.4本章小结 247

参考文献 247

第7章 联机手写汉字识别 251

7.1引言 251

7.1.1联机手写汉字识别方法回顾 252

7.2描述结构的统计模型——SSM 256

7.2.1基元间关系的描述 257

7.2.2结构统计模型SSM的定义及概率分析 259

7.2.3 SSM应用于联机手写汉字识别 262

7.2.4实验与分析 267

7.2.5小结 268

7.3路径受控HMM和时空统一模型 269

7.3.1路径受控HMM(PCHMM) 271

7.3.2 PCHMM在联机手写汉字识别中的应用 278

7.3.3联机手写汉字识别的时空统一模型——STUM 285

7.3.4实验与分析 286

7.3.5小结 292

7.4基于全局模式分析的统计结构特征 293

7.4.1联机汉字笔迹的结构分析 293

7.4.2联机手写汉字分类特征的分析与提取 297

7.4.3小结 308

7.5高性能联机手写汉字识别系统及其嵌入式系统 308

7.5.1联机手写汉字识别系统 308

7.5.2嵌入式联机手写识别系统 318

7.6本章小结 323

参考文献 324

第8章 利用上下文信息的汉字识别后处理 328

8.1概述 328

8.2汉字识别后处理模型 332

8.2.1汉字文本识别的整体模型 332

8.2.2利用多层语言知识的汉字识别整体模型 334

8.2.3整体模型的全局优化 335

8.2.4影响后处理性能的要素分析 336

8.3统计语言模型 337

8.3.1 n-gram模型的基本理论 337

8.3.2基于字的语言模型 342

8.3.3基于词的语言模型 345

8.4候选集的有效性 347

8.4.1候选集大小分析 347

8.4.2混淆矩阵获取 349

8.4.3扩充候选字集 351

8.4.4词条近似匹配算法 355

8.5文本识别后处理的实现 357

8.5.1字bigram模型的上下文处理 357

8.5.2字trigram模型的上下文处理 359

8.5.3词bigram模型的上下文处理 360

8.5.4字、词相结合的上下文处理 362

8.4.5利用上下文信息的汉字识别实验系统 366

8.6实验结果与分析 367

8.6.1实验数据说明 367

8.6.2语言模型的影响 369

8.6.3候选字集的影响 371

8.6.4文本识别混合后处理系统的影响 375

8.7本章小结 376

参考文献 378

第9章 脱机手写文档识别方法 380

9.1引言 380

9.2文本行识别研究概况 381

9.3基于过切分的脱机手写中文文本行识别方法 385

9.3.1脱机手写中文文本行识别方法 385

9.3.2基于分段的文本行识别搜索方法 399

9.3.3文本行切分识别中的语言模型自适应 404

9.3.4脱机手写中文文本识别系统 414

9.4基于HMM的无切分民族文字文档识别方法 416

9.4.1无切分识别方法的主要思想 418

9.4.2无切分文档识别方法中的特征提取 421

9.4.3无切分文档识别方法中的模型训练 424

9.4.4无切分文档识别方法中的模型优化 425

9.4.5无切分文档识别方法中的解码识别 430

9.4.6无切分维文文档识别研究的相关实验 432

9.4.7小结 436

9.5本章小结 436

参考文献 437

第10章 文档版面自动分析和理解 445

10.1版面处理的概念 445

10.2版面分析研究的历史和现状 447

10.2.1版面分析研究的分类 447

10.2.2版面分析工作的发展 458

10.2.3版面分析的困难 460

10.3基于多层次基元的版面分析模型 461

10.3.1多层次可信度的定义 462

10.3.2多层次可信度指导下的自底向上版面分析算法 463

10.3.3连通域层次 464

10.3.4行层次 464

10.3.5区域层次 467

10.3.6页面层次 467

10.3.7实验结果 468

10.4版面理解和重构 469

10.4.1版面理解和重构的需求 469

10.4.2文档结构模型 472

10.4.3版面理解 475

10.4.4版面重构 477

10.4.5原文重现的电子出版物制作系统 480

10.5本章小结 485

参考文献 485

第11章 蒙藏维多文种识别 490

11.1引言 490

11.1.1蒙藏维文识别 490

11.1.2民族文字识别的现状 492

11.1.3藏文及其识别 493

11.1.4维吾尔文及其识别 497

11.1.5蒙古文及其识别 499

11.2蒙藏维文识别的基本策略 501

11.2.1基本识别单元选择 501

11.2.2基本框架和关键技术 503

11.3多文种民族文字识别中的字符规一化 505

11.3.1基于基线分块的民族字符规一化策略 506

11.3.2规一化点阵大小选择 510

11.3.3位置规一化 512

11.3.4基于三次B样条函数的字符图像插值 512

11.3.5笔画宽度调整 516

11.4民族文字识别中的特征提取与特征变换 518

11.4.1改进型方向线素特征 518

11.4.2基于视觉特性的方向特征 522

11.4.3基于线性鉴别分析的特征变换 525

11.4.4实验结果 530

11.5民族文字识别中的级联分类器设计 536

11.5.1预分类 537

11.5.2基于鉴别学习MQDF的主分类器 544

11.5.3辅助分类 544

11.5.4实验结果 554

11.6藏文文本切分和藏文识别后处理 561

11.6.1藏文文本切分 561

11.6.2拼写规则与统计方法相结合的藏文识别后处理 568

11.7多民族语言文字识别系统的实现——TH-OCR统一平台民族文字识别系统 576

11.7.1统一平台多民族文字识别系统特点 577

11.7.2维-汉-英混排民族文字的识别 578

11.7.3蒙藏维多文种统一平台识别系统性能 580

11.7.4蒙藏维文档识别的跨文种翻译理解 584

11.8本章小结 586

参考文献 587

附录A 常用缩略语表 592

附录B 文字识别相关研究成果 593

附录C 文字识别相关成果主要奖励 594

附录D 已授权文字识别相关发明专利 599

附录E 文字识别相关的博士论文 601

附录F 本书中算法研究相关数据库 603

索引 608