《中文自然语言处理导论》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:徐睿峰,李斌阳,黄锦辉
  • 出 版 社:北京:科学出版社
  • 出版年份:2018
  • ISBN:9787030590442
  • 页数:133 页
图书介绍:本书主要向具备自然语言处理基本背景的读者介绍中文语言处理问题和技术。由于中西方语言之间的主要区别是在词汇层面上,所以本书主要探讨中文词法分析,以及中文词的概念、结构和词间语义。本书主要包括中国NLP介绍、中文词法处理、中文分词、未登录词法处理、自动中文搭配抽取等内容,可作为计算机科学相关专业的教材及教学参考书,也可供相关领域研究人员、工程技术人员使用。

第1章 介绍 1

1.1 中文自然语言处理是什么 1

1.2 关于本书 5

第2章 中文的词 6

2.1 引言 6

2.2 字、语素与词 6

2.3 词的构成 9

2.4 词的识别及分词 20

2.5 小结 20

第3章 中文的语素 21

3.1 引言 21

3.2 中文的特点 21

3.3 书写习惯 26

3.4 语言学特征 27

3.5 小结 35

第4章 中文分词 36

4.1 简介 36

4.2 中文分词的两个主要挑战 36

4.3 算法介绍 39

4.4 分词过程中的歧义 48

4.5 评价标准 52

4.6 开放工具 54

4.7 小结 55

第5章 未登录词识别 56

5.1 简介 56

5.2 未登录词的检测及识别 58

5.3 中文人名识别 60

5.4 中文组织名识别 62

5.5 中文地名识别 65

5.6 小结 66

第6章 词义 67

6.1 基本含义、概念及联系 67

6.2 框架、搭配及动词配价 68

6.3 中文字典/词典 69

6.4 Word Nets 72

6.5 小结 86

第7章 中文搭配 88

7.1 搭配的概念 88

7.2 定性性质 91

7.3 定量特征 92

7.4 搭配的分类 94

7.5 语言学资源 96

7.6 应用 99

7.7 小结 100

第8章 中文搭配自动抽取 101

8.1 介绍 101

8.2 基于窗口统计的方法 101

8.3 基于句法结构的方法 112

8.4 基于语义的方法 115

8.5 基于分类的方法 116

8.6 参考基准 118

8.7 小结 119

参考文献 120

附录 131