《古籍计算机自动断句标点与自动分词标引研究》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:黄建年著;候汉清主编
  • 出 版 社:芜湖:安徽师范大学出版社
  • 出版年份:2013
  • ISBN:9787567610019
  • 页数:164 页
图书介绍:本书以农业古籍为研究对象,研究了古籍断句标点、分词的历史与现状,重点探讨了计算机技术在农业古籍断句标点、分词标引中的应用,构建了农业古籍断句标点、分词标引的原型系统。主要研究内容如下:1)借鉴文本模式匹配、句法分析等技术,研究并设计出农业古籍自动断句标点的算法,设计出农业古籍断句标点的原型系统。2)借助N元分词、词典分词等技术,设计出农业古籍自动分词专用算法,设计出农业古籍分词的原型系统。本书学术性强,在古籍整理专业很有分量,可以视为古籍整理方面的最新、最前沿的图书。

1绪论 1

1.1课题依据及意义 1

1.2国内外研究综述 3

1.3研究的主要理论与技术路线 9

1.3.1断句标点 10

1.3.2分词标引 11

1.4研究的主要内容、结构与创新之处 12

1.4.1主要内容 13

1.4.2结构 13

1.4.3创新之处 14

2古籍计算机自动断句标点技术研究 18

2.1断句标点概述 18

2.1.1句读、圈点 18

2.1.2断句、破句 22

2.1.3标点 25

2.1.4普通古籍断句标点 33

2.1.5农业古籍断句标点 37

2.2古籍计算机自动断句标点技术进展 42

2.2.1自动断句标点的概念和意义 42

2.2.2自动断句标点研究进展 44

2.2.3自动断句和标点的基础 47

2.2.4自动断句标点存在的问题及对策 48

2.3古籍计算机自动断句标点算法、流程与功能设计 48

2.3.1传统古籍断句标点方法 48

2.3.2计算机辅助断句标点的主要算法 53

2.3.3计算机辅助断句标点的流程设计 54

2.3.4计算机断句标点的功能设计 55

2.3.5计算机断句标点规则库构建 74

2.4古籍计算机自动断句标点实验结果评价与展望 81

2.5本章小结 83

3古籍计算机自动分词标引技术研究 90

3.1古籍计算机自动分词标引研究进展 90

3.1.1古籍文本分词标引概念和意义 90

3.1.2古籍文本分词标引研究进展 91

3.1.3古籍文本分词标引的基础 96

3.1.4古籍文本分词标引存在的问题及对策 97

3.2古籍计算机自动分词标引的理论与关键技术研究 98

3.2.1分词词典研究 98

3.2.2分词系统介绍 99

3.3古籍计算机自动分词标引的主要算法与流程 101

3.3.1概述 101

3.3.2古籍分词主要算法 102

3.3.3古籍分词流程设计 104

3.3.4古籍分词词典群构建 106

3.4古籍计算机自动分词标引效果测试 110

3.4.1数据来源 110

3.4.2新词识别 110

3.4.3分词结果 112

3.5古籍计算机自动分词标引结果分析 114

3.5.1词频等级与频次乘积研究 114

3.5.2齐夫第一定律验证 116

3.6古籍计算机自动分词标引结果应用 121

3.6.1古籍索引编制 121

3.6.2古籍词库编纂 122

3.6.3同义词识别 123

3.6.4自动摘要与自动标引 123

3.6.5古籍自动问答系统 124

3.7本章小结 124

4古籍计算机整理与开发系统的构建与集成 133

4.1古籍计算机整理与开发系统的研究背景 134

4.2古籍计算机自动断句标点子系统 134

4.2.1实验语料 134

4.2.2系统功能结构 135

4.3古籍计算机自动分词标引子系统 139

4.3.1实验语料 139

4.3.2系统功能结构 139

4.4农业古籍计算机整理与开发系统设置子系统 144

4.4.1用户单位设置 145

4.4.2用户账号管理 145

4.4.3试验数据清除 145

4.4.4数据维护与备份 146

4.5本章小结 146

5结语 147

6附录 149

附录一 古籍计算机自动断句样例 149

附录二 古籍计算机自动标点样例 151

附录三 古籍计算机自动分词样例 157

附录四 古籍计算机自动标点规则 162