《清华TH-OCR技术应用与开发》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:郭繁夏编著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:1996
  • ISBN:7302021384
  • 页数:146 页
图书介绍:

上篇 清华TH-OCR?技术简介 3

第1章 OCR技术与系统概述 3

1.1 OCR技术的发展背景 3

1.2 中文OCR技术简介 3

1.2.1 什么是中文OCR 3

1.2.2 为什么要使用中文OCR系统 5

第2章 清华TH-OCR?系统简介 7

2.1 清华TH-OCR系统的研究与开发 7

2.1.1 汉字识别的主要困难 7

2.1.2 清华TH-OCR系统的发展历程 9

2.2 清华TH-OCR系统的特点 11

2.2.1 清华TH-OCR的基本原理和主要设计思想 11

2.2.2 清华TH-OCR的主要特点 12

2.2.3 清华TH-OCR的技术规范 14

中篇 清华TH-OCR?应用指南 17

第3章 安装清华TH-OCR?系统 17

3.1 清华TH-OCR系统的运行环境 17

3.1.1 清华TH-OCR系统的硬件需求 17

3.1.2 清华TH-OCR系统的软件支持 17

3.2 清华TH-OCR系统的安装 18

3.2.1 清华TH-OCR系统的基本组成 18

3.2.2 清华TH-OCR系统安装须知 18

3.2.3 清华TH-OCR系统的安装步骤 18

第4章 清华TH-OCR?基本操作流程 27

4.1 文字识别(OCR)系统的一般流程 27

4.2 清华TH-OCR系统的操作流程 27

4.2.1 清华TH-OCR系统操作流程之一(分步操作) 28

4.2.2 清华TH-OCR系统操作流程之二(自动操作) 29

4.3 本章小结 30

第5章 清华TH-OCR?功能介绍 31

5.1 清华TH-OCR系统的基本风格 31

5.2 清华TH-OCR的菜单功能 34

5.3 清华TH-OCR图象环境 38

5.4 清华TH-OCR文本编辑环境 40

5.5 本章小结 42

第6章 图象扫描处理与文字识别 43

6.1 在清华TH-OCR系统中扫描图象 43

6.1.1 在文字识别系统中扫描图象的最主要参数 43

6.1.2 扫描图象前的准备步骤 46

6.1.3 使用扫描仪自己的界面扫描图象 47

6.1.4 使用清华TH-OCR特定的界面扫描图象 48

6.2 图象文件的打开与保存 51

6.3 图象的基本处理 52

6.3.1 整幅图象处理 52

6.3.2 局部图象处理 55

6.3.3 倾斜校正 58

6.3.4 打印输出图象与显示图象 61

6.4 版面分析 65

6.4.1 手动版面分析 65

6.4.2 自动版面分析 67

6.4.3 设置版面区域属性 68

6.5 文字识别 69

6.5.1 文字识别前的准备 69

6.5.2 文字识别操作步骤 71

6.6 本章小结 72

第7章 编辑修改识别结果 73

7.1 进入清华TH-OCR系统的编辑环境 73

7.2 在可疑字之间快速移动光标 75

7.3 使用Microsoft Windows标准的编辑操作 76

7.3.1 选定感兴趣区域 77

7.3.2 剪切(Cut) 78

7.3.3 复制(Copy) 78

7.3.4 粘贴(Paste) 79

7.3.5 清除(Clear) 80

7.4 使用清华TH-OCR特有的编辑功能 80

7.4.1 前向词汇 81

7.4.2 逆向词汇 83

7.4.3 相似字 84

7.4.4 常用符号 86

7.4.5 行逆序 87

7.5 打印输出识别结果文本 87

7.6 本章小结 88

下篇 清华TH-OCR?进阶开发 91

第8章 系统的选项与设置 91

8.1 清华TH-OCR系统的选项 91

8.1.1 进入清华TH-OCR系统的设置对话框 91

8.1.2 设置对话框中的系统选项 92

8.1.3 设置对话框中的识别选项 94

8.2 清华TH-OCR系统的参数文件WINOCR.INI 97

8.2.1 参数文件WINOCR.INI的内容 98

8.2.2 图象格式控制参数 99

8.2.3 窗口参数 99

8.2.4 系统参数 99

8.2.5 扫描参数 100

8.2.6 识别参数 100

第9章 批量处理 101

9.1 批量处理的概念 101

9.1.1 多页文件的连续扫描识别 101

9.1.2 对选定的多个图象文件进行集中识别处理 102

9.2 使用清华TH-OCR系统的自动批量处理提高工作效率 102

9.2.1 连续扫描图象进行识别处理 103

9.2.2 批量打开多个图象文件识别处理 104

9.2.3 切换不同页面 105

9.2.4 进行批量识别 108

9.3 关闭所有文件对话框 108

9.3.1 合并所有结果文件 109

9.3.2 合并后删除原文本文件 110

9.3.3 删除跟踪文件 110

9.3.4 以新名存储暂时文件 111

9.3.5 删除图象文件 112

第10章 新字学习与出错处理 113

10.1 在清华TH-OCR系统中学习新字 113

10.1.1 计算机在认字方面还是个孩子 113

10.1.2 如何进入新字学习状态 114

10.1.3 新字的学习 114

10.1.4 用户库的修改 115

10.2 清华TH-OCR系统可能遇到的主要问题 117

10.2.1 有关扫描仪的问题 117

10.2.2 有关系统资源的问题 117

10.2.3 有关操作的问题 118

10.3 清华TH-OCR系统的出错信息及其处理办法 118

第11章 与别的软件配合使用形成系统 125

11.1 在其它应用系统中直接使用清华TH-OCR的识别结果 125

11.1.1 在清华TH-OCR系统中进行设定 125

11.1.2 在应用系统中使用命令行参数调用清华TH-OCR系统 126

11.2 清华TH-OCR系统的深入编程 126

11.2.1 关于TW_DEF.H文件的说明 126

11.2.2 版面分析和倾斜校正接口函数 131

11.2.3 识别处理接口函数 133

附录A 清华TH-OCR?操作速查表 141

A.1 清华TH-OCR系统的软件安装 141

A.1.1 清华TH-OCR系统的资源需求 141

A.1.2 清华TH-OCR系统的安装步骤 141

A.2 清华TH-OCR系统的操作流程 142

A.3 清华TH-OCR系统的图象环境 143

A.4 清华TH-OCR系统的编辑环境 144

附录B 清华TH-OCR?产品简介 145

B.1 专业版本 145

B.1.1 清华TH-OCR NT for Windows 145

B.1.2 清华TH-OCR V5.0 for Windows 145

B.1.3 清华TH-OCR V5.0 for DOS 145

B.2 标准版本 146

B.2.1 清华TH-OCR NS for Windows 146

B.2.2 清华TH-OCR LV for Windows 146

B.2.3 清华TH-OCR LV4.5 for DOS 146