《藏文文本自动处理方法研究》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:珠杰著
  • 出 版 社:成都:西南交通大学出版社
  • 出版年份:2018
  • ISBN:9787564361532
  • 页数:121 页
图书介绍:随着藏文信息技术的快速发展,在探索藏文自然语言处理问题,如藏文字处理、词处理、短语处理和语句处理等领域取得了许多研究成果,但也存在很多尚未解决的问题。本书从目前需要亟待解决的几个关键问题出发,研究其解决方案和相应的实现算法,是藏文信息处理技术研究的相关成果的总结。全书共分3个部分,第1部分以藏文字处理为研究对象,讨论了藏文排序方法、藏文音节规则和自动拼写算法;第2部分以藏文词处理为研究对象,讨论了藏文停用词自动处理方法、藏文人名识别方法,研究了CRF和深度学习的藏文人名识别技术;第3部分以藏文自动校对为研究对象,讨论了基于音节规则的藏文拼写检查算法、藏文自动校对系统框架和接续关系检查算法。

第一篇 藏文字处理技市 3

第一章 藏文基础理论 3

第一节 藏文字符 3

第二节 藏文音节 3

第三节 藏文词语 4

第四节 藏语句子 5

第二章 基于藏文编码GB的藏文排序方法研究 7

第一节 概述 7

第二节 藏文字排序规则 7

第三节 藏文字排序算法 8

第四节 结论 11

第三章 藏文音节规则库的建立与应用分析 12

第一节 概述 12

第二节 藏文的结构 12

第三节 藏文规则库的建立 13

第四节 规则库的应用 23

第五节 结论 26

第四章 藏文音节规则模型及应用 28

第一节 概述 28

第二节 藏文音节结构 28

第三节 藏文音节规则模型 30

第四节 规则方法的应用研究 34

第五节 结论与展望 37

第二篇 藏文词处理方法 41

第五章 藏文停用词选取与自动处理方法研究 41

第一节 概述 41

第二节 相关研究工作 41

第三节 藏文停用词选取方法 42

第四节 停用词处理实验 44

第五节 结论与展望 51

第六章 基于词向量的藏文词性标注方法研究 53

第一节 概述 53

第二节 相关研究工作 53

第三节 词性标注算法 54

第四节 实验及数据分析 59

第五节 结论与展望 62

第七章 基于条件随机场的藏文人名识别技术研究 64

第一节 概述 64

第二节 相关研究工作 65

第三节 藏文人名特征 66

第四节 模型及人名识别 67

第五节 实验 72

第六节 结论与展望 77

第八章 基于深度学习模型的藏文人名识别方法研究 80

第一节 概述 80

第二节 相关研究工作 80

第三节 深度学习模型 81

第四节 训练模型 84

第五节 词向量训练 85

第六节 实验及数据分析 88

第三篇 藏文自动校对方法 97

第九章 TSRM藏文拼写检查算法 97

第一节 概述 97

第二节 藏文音节规则模型 98

第三节 拼写检查算法 100

第四节 实验 102

第五节 结论与展望 105

第十章 藏文文本自动校对方法及系统设计 107

第一节 概述 107

第二节 藏文文本自动校对系统 107

第三节 藏文文本校对方法 111

第四节 结论与展望 116

第十一章 文本自动处理技术比较 118

第一节 字层面的处理 118

第二节 词层面的处理 119

第三节 序列标注层面的处理 119

第四节 句子层面的处理 120