当前位置:首页 > 语言文字
语言变体语料库构建及计算模型
语言变体语料库构建及计算模型

语言变体语料库构建及计算模型PDF电子书下载

语言文字

  • 电子书积分:9 积分如何计算积分?
  • 作 者:徐凡著
  • 出 版 社:北京:科学出版社
  • 出版年份:2019
  • ISBN:7030599551
  • 页数:158 页
图书介绍:本书从人工智能技术和语言变体相结合的视角,结合自然语言处理、机器学习、神经网络、语音识别、语料库语言学等相关技术,以作者的一系列研究成果为内容主线,系统介绍了语言变体(相似语言)研究的语料库构建及计算模型。本书对相似语言及语言变体中的关键技术进行了较为深入的研究,提出了相关问题的一些解决方法,并设计了相应的算法和实验。实验表明,本书提出的这些方法有助于提高相似语言的分析性能,同时减少对大规模语料库的依赖性,为今后的相似语言变体分析研究奠定了一个重要基础,为同类研究提供了一个参考。
《语言变体语料库构建及计算模型》目录

第1章 相似语言及变体研究概述 1

1.1相似语言及变体相关概念 1

1.2相似语言及变体研究综述 2

1.2.1语料库资源建设 2

1.2.2计算模型 4

1.2.3评测指标 6

1.3本章小结 7

参考文献 7

第2章 相关技术 10

2.1传统技术 10

2.1.1支持向量机 10

2.1.2统计语言模型 12

2.1.3互信息 12

2.1.4相似度计算 13

2.1.5隐马尔可夫模型 15

2.2最新深度学习技术 16

2.2.1词向量 16

2.2.2神经网络语言模型 17

2.2.3 word2vec模型 18

2.2.4多层感知机 19

2.2.5循环神经网络 20

2.2.6卷积神经网络 21

2.3本章小结 22

参考文献 22

第3章 海峡两岸及香港地区三元组和词对齐语料库构建 24

3.1语言变体 24

3.2词对齐定义 27

3.3三元组和词对齐语料库 28

3.3.1处理框架 28

3.3.2标注规范 29

3.3.3三元组语料 30

3.3.4词对齐语料 32

3.4本章小结 34

参考文献 35

第4章 海峡两岸及香港地区词对齐抽取计算模型 37

4.1相关工作 37

4.2基于word2vec的两阶段词对齐抽取模型 38

4.2.1阶段1模型 38

4.2.2阶段2模型 40

4.3基于词映射规则的词对齐抽取模型 40

4.3.1词对齐算法 41

4.3.2词映射规则后处理 41

4.4实验设置及结果分析 43

4.4.1实验设置 43

4.4.2评测指标 43

4.4.3实验结果分析 43

4.5本章小结 49

参考文献 50

第5章 句子级中国、新加坡、马来西亚语言类型识别计算模型 52

5.1相关工作 52

5.2语言类型识别模型 53

5.2.1特征抽取 53

5.2.2分类器构建 56

5.3实验设置及结果分析 57

5.3.1实验设置 57

5.3.2实验结果分析 58

5.4本章小结 61

参考文献 61

第6章 多模态赣方言篇章平行语料库构建 63

6.1赣方言概述 63

6.2多模态赣方言篇章平行语料库构建 65

6.2.1标注规范 66

6.2.2标注过程 67

6.2.3篇章级赣方言平行语料库标注实例 67

6.2.4语料统计及标注质量 68

6.3本章小结 69

参考文献 69

第7章 句子级赣方言语言类型文本识别计算模型 71

7.1基于特征抽取的赣方言识别模型 71

7.1.1特征抽取 71

7.1.2分类器构建 71

7.2基于深度学习的赣方言识别模型 71

7.3实验设置及结果分析 72

7.3.1实验设置 72

7.3.2实验结果分析 73

7.4本章小结 78

参考文献 78

第8章 赣方言语音识别计算模型 80

8.1语音识别简介 80

8.1.1语音识别框架 80

8.1.2国内外研究现状 83

8.2基于Kaldi的赣方言语音识别 86

8.2.1 Kaldi简介 86

8.2.2赣方言语音识别模型 86

8.3实验设置及结果分析 88

8.3.1实验设置 88

8.3.2评测指标 89

8.3.3实验结果分析 89

8.4本章小结 90

参考文献 90

第9章 听音识人——端到端赣方言点识别计算模型及平台 92

9.1基于语音识别的赣方言点识别基准模型 92

9.1.1模型框架 92

9.1.2基准模型实验设置 93

9.1.3基准模型实验结果分析 94

9.2语音驱动的赣方言识别模型 95

9.2.1基于语音特征的模型框架 95

9.2.2混合模型 96

9.3实验设置及结果分析 96

9.3.1实验设置 96

9.3.2实验结果分析 96

9.4听音识人——赣方言智能处理平台 100

9.4.1 PC型界面 100

9.4.2移动型界面 102

9.5本章小结 102

附录 计算机自动抽取的海峡两岸及香港地区三元组 105

返回顶部