文字识别 原理、方法和实践PDF电子书下载
- 电子书积分:18 积分如何计算积分?
- 作 者:丁晓青,王言伟等著
- 出 版 社:北京:清华大学出版社
- 出版年份:2017
- ISBN:9787302454625
- 页数:618 页
第1章 绪论 1
1.1引言 1
1.2文字和汉字 2
1.2.1文字的代码表示 3
1.2.2汉字的字体字形 4
1.2.3汉字的特点 6
1.2.4中文信息处理 8
1.3文字识别和汉字识别 8
1.4文字识别研究历程 10
1.5文字识别分类 11
1.5.1按照不同文种文字和文档的识别技术分类 11
1.5.2按照获取图像方式和识别对象不同分类 12
1.5.3单个字符识别和文档篇章识别 14
1.6文字识别与笔迹鉴别 15
1.7汉字识别的基本方法——基于视觉感知的汉字识别方法 16
1.8关于本书 20
参考文献 21
第2章 模式识别和模式识别信息熵理论 23
2.1引言:模式与模式识别 23
2.2基于贝叶斯统计决策的模式识别 26
2.3模式识别统一信息熵理论 30
2.3.1特征和类别及其相关信息熵 31
2.3.2后验熵:最优贝叶斯分类器误识率的上限 36
2.3.3模式识别的学习与识别信息过程 38
2.3.4互信息:决定模式识别性能的鉴别熵 40
2.4正态分布条件下的模式识别信息熵系统 41
2.5最大互信息鉴别分析(互信息鉴别子空间模式识别) 45
2.5.1最大互信息子空间线性鉴别分析方法 45
2.5.2最大互信息线性鉴别分析与线性鉴别分析LDA 46
2.6特征选择的信息熵准则 47
2.6.1基于错误概率的类别可分性准则 47
2.6.2基于有效互信息的类别可分性准则 48
2.7从信息熵分析看提高识别性能的途径 50
2.8汉字集合和汉字文本的信息熵 52
2.8.1汉字集合的信息熵 52
2.8.2汉字文本的信息熵和汉字的极限熵 53
2.9本章小结 55
参考文献 56
第3章 汉字识别的特征提取 59
3.1引言 59
3.2汉字字符图像规一化预处理 60
3.2.1线性规一化 61
3.2.2非线性规一化 65
3.2.3基于整体密度均衡的非线性规一化 66
3.3汉字识别中的特征抽取 68
3.3.1结构特征 69
3.3.2统计特征 70
3.4汉字识别特征提取研究的发展历程 74
3.4.1基于图像变换的印刷汉字识别特征和系统 74
3.4.2基于形态学汉字结构分析的两级印刷汉字识别特征和系统 74
3.4.3汉字笔画密度微结构全局特征及多字体汉字识别系统 75
3.4.4基于汉字笔画方向网格特征的鲁棒汉字识别系统 77
3.5笔画方向线素特征 80
3.5.1方向线素特征的形成方法 80
3.5.2网格化方向线素特征 82
3.5.3对原模糊分块方法的改进——低通采样方向线素特征 86
3.5.4实验和结果 86
3.6基于Gabor滤波器的高性能汉字识别方向特征 88
3.6.1 Gabor变换理论分析 88
3.6.2适用于汉字识别的Gabor滤波器组设计及实验验证 91
3.6.3对Gabor滤波器组输出的非线性变换 94
3.6.4分块特征的抽取 96
3.6.5实验及结果 97
3.7汉字识别梯度方向特征抽取方法 100
3.7.1梯度方向特征 100
3.7.2梯度方向特征的快速算法 101
3.8不同笔画方向特征的识别性能实验比较 102
3.9本章小结 104
参考文献 104
第4章 特征的鉴别分析和分布整形 109
4.1引言 109
4.2线性鉴别分析 110
4.2.1优化准则 110
4.2.2变换形式和最优解 110
4.2.3变换的分解形式 111
4.2.4启发式讨论 113
4.2.5实验与结果 115
4.2.6小结 118
4.3正则化线性鉴别分析 118
4.3.1小样本带来的问题 118
4.3.2利用正则化估计协方差阵 119
4.3.3实验结果 121
4.4异方差鉴别分析 123
4.4.1基于极大似然估计的异方差线性鉴别分析 124
4.4.2基于Chernoff准则的异方差线性鉴别分析 127
4.4.3基于Mahalanobis准则的异方差线性鉴别分析 129
4.4.4实验结果 130
4.4.5小结 133
4.5特征统计分布整形变换 134
4.5.1特征分布的整形 134
4.5.2正态性检验 135
4.5.3 Box-Cox变换 137
4.5.4方向线素及梯度特征的整形 140
4.5.5实验与结果 142
4.6本章小结 145
参考文献 145
第5章 模式识别分类器设计/统计模式分类方法 148
5.1引言 148
5.2贝叶斯判决理论 150
5.3正态分布下的贝叶斯分类器 152
5.3.1正态分类模型 152
5.3.2最小距离分类器MDC 154
5.3.3线性距离分类器LDC 155
5.3.4二次鉴别函数分类器QDF 156
5.3.5二次鉴别函数 157
5.3.6 QDF误差分析 158
5.4改进二次鉴别函数分类器MQDF 159
5.4.1修正二次鉴别分类MQDF 159
5.4.2 QDF修正形式的贝叶斯估计推导 160
5.4.3实验与结果 163
5.5系统实现与应用 164
5.5.1非限定脱机手写汉字识别系统 165
5.5.2多字体印刷中、日、韩文识别系统 169
5.6分类器的置信度分析 172
5.6.1分类器的置信度和广义置信度 172
5.6.2基于距离的分类器的广义置信度估计 175
5.6.3多层前向神经网络分类器广义置信度估计 180
5.6.4从广义置信度求置信度的方法 181
5.6.5使用ACT估计后验概率 181
5.6.6置信度分析在字符识别中的应用 182
5.6.7小结 187
5.7分类器集成 187
5.7.1集成的3个层次 187
5.7.2基于线性回归的多分类器集成 190
5.7.3利用线性回归提高后验概率估计的准确性 191
5.7.4后验概率的估计误差与误识率的关系 193
5.7.5实验结果 194
5.7.6小结 198
5.8本章小结 198
参考文献 199
第6章 无约束手写汉字识别分类器鉴别学习 202
6.1引言 202
6.2基于最小错误率的鉴别学习 204
6.2.1最小错误率学习 204
6.2.2基于MCE的多模板距离分类器参数鉴别学习 208
6.2.3基于MCE的MQDF分类器参数鉴别学习 210
6.2.4基于MCE的正交混合高斯模型的鉴别学习 212
6.3基于启发式的鉴别学习方法 222
6.3.1矫正学习 222
6.3.2镜像学习方法 232
6.3.3样本重要性加权学习方法 235
6.4本章小结 247
参考文献 247
第7章 联机手写汉字识别 251
7.1引言 251
7.1.1联机手写汉字识别方法回顾 252
7.2描述结构的统计模型——SSM 256
7.2.1基元间关系的描述 257
7.2.2结构统计模型SSM的定义及概率分析 259
7.2.3 SSM应用于联机手写汉字识别 262
7.2.4实验与分析 267
7.2.5小结 268
7.3路径受控HMM和时空统一模型 269
7.3.1路径受控HMM(PCHMM) 271
7.3.2 PCHMM在联机手写汉字识别中的应用 278
7.3.3联机手写汉字识别的时空统一模型——STUM 285
7.3.4实验与分析 286
7.3.5小结 292
7.4基于全局模式分析的统计结构特征 293
7.4.1联机汉字笔迹的结构分析 293
7.4.2联机手写汉字分类特征的分析与提取 297
7.4.3小结 308
7.5高性能联机手写汉字识别系统及其嵌入式系统 308
7.5.1联机手写汉字识别系统 308
7.5.2嵌入式联机手写识别系统 318
7.6本章小结 323
参考文献 324
第8章 利用上下文信息的汉字识别后处理 328
8.1概述 328
8.2汉字识别后处理模型 332
8.2.1汉字文本识别的整体模型 332
8.2.2利用多层语言知识的汉字识别整体模型 334
8.2.3整体模型的全局优化 335
8.2.4影响后处理性能的要素分析 336
8.3统计语言模型 337
8.3.1 n-gram模型的基本理论 337
8.3.2基于字的语言模型 342
8.3.3基于词的语言模型 345
8.4候选集的有效性 347
8.4.1候选集大小分析 347
8.4.2混淆矩阵获取 349
8.4.3扩充候选字集 351
8.4.4词条近似匹配算法 355
8.5文本识别后处理的实现 357
8.5.1字bigram模型的上下文处理 357
8.5.2字trigram模型的上下文处理 359
8.5.3词bigram模型的上下文处理 360
8.5.4字、词相结合的上下文处理 362
8.4.5利用上下文信息的汉字识别实验系统 366
8.6实验结果与分析 367
8.6.1实验数据说明 367
8.6.2语言模型的影响 369
8.6.3候选字集的影响 371
8.6.4文本识别混合后处理系统的影响 375
8.7本章小结 376
参考文献 378
第9章 脱机手写文档识别方法 380
9.1引言 380
9.2文本行识别研究概况 381
9.3基于过切分的脱机手写中文文本行识别方法 385
9.3.1脱机手写中文文本行识别方法 385
9.3.2基于分段的文本行识别搜索方法 399
9.3.3文本行切分识别中的语言模型自适应 404
9.3.4脱机手写中文文本识别系统 414
9.4基于HMM的无切分民族文字文档识别方法 416
9.4.1无切分识别方法的主要思想 418
9.4.2无切分文档识别方法中的特征提取 421
9.4.3无切分文档识别方法中的模型训练 424
9.4.4无切分文档识别方法中的模型优化 425
9.4.5无切分文档识别方法中的解码识别 430
9.4.6无切分维文文档识别研究的相关实验 432
9.4.7小结 436
9.5本章小结 436
参考文献 437
第10章 文档版面自动分析和理解 445
10.1版面处理的概念 445
10.2版面分析研究的历史和现状 447
10.2.1版面分析研究的分类 447
10.2.2版面分析工作的发展 458
10.2.3版面分析的困难 460
10.3基于多层次基元的版面分析模型 461
10.3.1多层次可信度的定义 462
10.3.2多层次可信度指导下的自底向上版面分析算法 463
10.3.3连通域层次 464
10.3.4行层次 464
10.3.5区域层次 467
10.3.6页面层次 467
10.3.7实验结果 468
10.4版面理解和重构 469
10.4.1版面理解和重构的需求 469
10.4.2文档结构模型 472
10.4.3版面理解 475
10.4.4版面重构 477
10.4.5原文重现的电子出版物制作系统 480
10.5本章小结 485
参考文献 485
第11章 蒙藏维多文种识别 490
11.1引言 490
11.1.1蒙藏维文识别 490
11.1.2民族文字识别的现状 492
11.1.3藏文及其识别 493
11.1.4维吾尔文及其识别 497
11.1.5蒙古文及其识别 499
11.2蒙藏维文识别的基本策略 501
11.2.1基本识别单元选择 501
11.2.2基本框架和关键技术 503
11.3多文种民族文字识别中的字符规一化 505
11.3.1基于基线分块的民族字符规一化策略 506
11.3.2规一化点阵大小选择 510
11.3.3位置规一化 512
11.3.4基于三次B样条函数的字符图像插值 512
11.3.5笔画宽度调整 516
11.4民族文字识别中的特征提取与特征变换 518
11.4.1改进型方向线素特征 518
11.4.2基于视觉特性的方向特征 522
11.4.3基于线性鉴别分析的特征变换 525
11.4.4实验结果 530
11.5民族文字识别中的级联分类器设计 536
11.5.1预分类 537
11.5.2基于鉴别学习MQDF的主分类器 544
11.5.3辅助分类 544
11.5.4实验结果 554
11.6藏文文本切分和藏文识别后处理 561
11.6.1藏文文本切分 561
11.6.2拼写规则与统计方法相结合的藏文识别后处理 568
11.7多民族语言文字识别系统的实现——TH-OCR统一平台民族文字识别系统 576
11.7.1统一平台多民族文字识别系统特点 577
11.7.2维-汉-英混排民族文字的识别 578
11.7.3蒙藏维多文种统一平台识别系统性能 580
11.7.4蒙藏维文档识别的跨文种翻译理解 584
11.8本章小结 586
参考文献 587
附录A 常用缩略语表 592
附录B 文字识别相关研究成果 593
附录C 文字识别相关成果主要奖励 594
附录D 已授权文字识别相关发明专利 599
附录E 文字识别相关的博士论文 601
附录F 本书中算法研究相关数据库 603
索引 608
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《基于地质雷达信号波的土壤重金属污染探测方法研究》赵贵章 2019
- 《语文教育教学实践探索》陈德收 2018
- 《第一性原理方法及应用》李青坤著 2019
- 《计算机组成原理解题参考 第7版》张基温 2017
- 《彼得·布鲁克导演实践研究》邓小玲著 2019
- 《反思性实践》胡红梅, 2019
- 《数学物理方法与仿真 第3版》杨华军 2020
- 《Helmholtz方程的步进计算方法研究》李鹏著 2019
- 《高含硫气藏开发腐蚀控制技术与实践》唐永帆,张强 2018
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019