《统计语言学习》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:(美)欧仁·查尼阿克(EUGENECHARNIAK)著;胡凤国,冯志伟译
  • 出 版 社:北京:世界图书出版公司
  • 出版年份:2016
  • ISBN:9787519215484
  • 页数:197 页
图书介绍:本书面向的读者对象是有着传统计算机科学知识背景的研究人员和科学工作者,主要介绍基于统计的语言处理技术——单词标注(word tagging)、基于概率上下文无关语法(PCFG,probabilistic context-free grammar)的剖析(parsing,又称为句法分析)、语法归纳(grammar induction)、句法排歧(syntactic disambiguation)等。

第1章 标准模型 1

1.1 两种技术 1

1.2 形态学和单词知识 3

1.3 句法和上下文无关语法 5

1.4 线图分析 10

1.5 意义和语义处理 19

1.6 练习 21

第2章 统计模型和英语的熵 24

2.1 概率论基础 24

2.2 统计模型 28

2.3 语音识别 30

2.4 熵 31

2.5 马尔可夫链 37

2.6 交叉熵 38

2.7 用交叉熵对模型进行评测 40

2.8 练习 44

第3章 隐马尔可夫模型及其两个应用 45

3.1 英语的三元语法模型 45

3.2 隐马尔可夫模型 50

3.3 词性标注 53

3.4 练习 59

第4章 隐马尔可夫模型的算法 61

4.1 寻找最可能的路径 61

4.2 HMM输出概率计算 65

4.3 HMM训练 69

4.4 练习 80

第5章 概率上下文无关语法 83

5.1 概率语法 83

5.2 PCFG和句法歧义 87

5.3 PCFG和语法归纳 89

5.4 PCFG和非语法性 91

5.5 PCFG和语言模型 92

5.6 PCFG的基本算法 94

5.7 练习 95

第6章 PCFG的数学原理 96

6.1 HMM和PCFG的关系 96

6.2 用PCFG为句子指派概率 98

6.3 PCFG训练 106

6.4 练习 109

第7章 概率语法学习 111

7.1 简单的方法为什么会失败 112

7.2 依存语法学习 114

7.3 通过括号语料库进行学习 118

7.4 部分语法的改进 121

7.5 练习 126

第8章 句法排歧 127

8.1 处理介词短语的简单方法 127

8.2 使用语义信息 133

8.3 关系从句依附问题 135

8.4 词汇/语义信息的统一应用 139

8.5 练习 143

第9章 词类和词义 145

9.1 聚类 145

9.2 根据下一个单词进行聚类 146

9.3 利用句法信息进行聚类 151

9.4 单词聚类中的问题 155

9.5 练习 157

第10章 词义及排歧 159

10.1 利用外部信息判定词义 160

10.2 不利用外部信息判定词义 163

10.3 意义和选择限制 168

10.4 讨论 172

10.5 练习 174

参考文献 175

符号表 179

英中对照术语表 181

中英对照术语表 190