《计算语言学》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:刘颖编著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2014
  • ISBN:9787302378143
  • 页数:291 页
图书介绍:计算语言学是一门涉及语言学、计算机科学和数学等多门学科的交叉学科,覆盖面很广,本书侧重最经典的工作,阐述计算语言学的基本理论和方法。主要介绍现代词汇理论、句法理论和语义理论,词法、句法和语义阶段重要的分析算法。介绍计算语言学的主要应用领域—信息检索、自动分类和机器翻译的基本原理和最新进展。

第1章 计算语言学简介 1

1.1 计算语言学 1

1.1.1 计算语言学概念 1

1.1.2 计算语言学与计算机科学 1

1.1.3 计算语言学与语言学 2

1.1.4 计算语言学与数理语言学 2

1.1.5 计算语言学与自然语言 3

1.2 计算语言学主要研究的内容 3

1.3 计算语言学理论的主要用途 4

1.3.1 机器翻译 4

1.3.2 语音自动识别和自动生成 5

1.3.3 自动文摘 5

1.3.4 自动校对 5

1.3.5 自然语言理解 6

1.3.6 信息自动检索 6

1.3.7 自动问答 7

1.3.8 自动分类 7

1.3.9 信息抽取 7

1.4 计算语言学研究的基本方法 8

1.4.1 理性主义和经验主义 8

1.4.2 理性主义和经验主义的区别 9

1.5 计算语言学的发展历程 10

1.6 本章小结 16

第2章 机器词典 17

2.1 《现代汉语语法信息词典》 17

2.2 《同义词词林》 25

2.3 Wordnet 27

2.4 Framenet 40

2.5 《知网》 46

2.6 本章小结 51

第3章 词法分析 52

3.1 汉语的自动分词 52

3.1.1 词与自动分词 52

3.1.2 汉语自动分词的重要性 53

3.1.3 汉语自动分词方法 53

3.1.4 汉语切分歧义及其处理 59

3.1.5 未登录词的处理 62

3.1.6 汉语分词的难点 62

3.1.7 汉语分词评测 63

3.2 屈折语的词法分析 64

3.2.1 屈折语的词法分析 64

3.2.2 屈折语的词法分析技术 64

3.2.3 词法分析的原因 66

3.2.4 词法分析的程度 67

3.3 日语分词 67

3.3.1 日语词语特征 67

3.3.2 日语分词的常用方法 67

3.3.3 日语切词和词性标注 68

3.3.4 日语开源切分和标注器 70

3.4 本章小结 72

第4章 词性标注 73

4.1 词性标注概述 73

4.2 词性标注集 74

4.3 词性标注的研究方法 75

4.3.1 规则方法 76

4.3.2 统计方法进行词性标注 77

4.3.3 统计与规则相结合的方法 80

4.3.4 基于转换的错误驱动学习 81

4.4 本章小结 83

第5章 形式语言理论与自动机 84

5.1 形式语言理论 84

5.1.1 形式语法 84

5.1.2 形式语法组成 85

5.1.3 形式语法的定义 85

5.1.4 形式语法的特点 86

5.1.5 研究形式语法的必要性 86

5.1.6 语法的类型 86

5.2 自动机理论 88

5.2.1 图灵机 89

5.2.2 线性有界自动机 90

5.2.3 有限自动机 90

5.2.4 下推自动机 91

5.3 乔姆斯基层级和自然语言 93

5.3.1 文法、自动机和语言的关系 93

5.3.2 哪一种语法最宜于用来生成自然语言的句子 93

5.4 本章小结 96

第6章 现代句法理论 97

6.1 转换生成语法 98

6.1.1 经典理论 99

6.1.2 乔姆斯基的标准理论 100

6.1.3 扩充式标准理论 102

6.2 广义的短语结构语法 106

6.2.1 引言 106

6.2.2 句法规则 107

6.2.3 特征制约系统 112

6.2.4 语义解释系统 116

6.3 树粘接语法 116

6.4 中心词驱动的短语结构语法 120

6.5 功能合一文法 123

6.5.1 复杂特征集 123

6.5.2 合一运算 125

6.6 词汇功能文法 126

6.6.1 引言 126

6.6.2 基本成分 127

6.6.3 词库部分 128

6.6.4 LFG的两个语法层次结构 129

6.6.5 功能合格条件 133

6.6.6 词汇功能语法特点 135

6.7 范畴语法 135

6.8 依存语法 137

6.9 链语法(Link Grammar) 141

6.10 本章小结 147

第7章 句法分析 148

7.1 句法分析概念 148

7.1.1 分析策略 148

7.1.2 句法分析 149

7.2 有限状态转移网络、递归转移网络和扩充转移网络 149

7.2.1 有限状态转移网络 149

7.2.2 递归转移网络 151

7.2.3 扩充转移网络 154

7.3 自顶向下剖析 157

7.4 厄尔利算法 160

7.5 LR分析算法 163

7.5.1 LR(0)算法 163

7.5.2 LR(1)算法 166

7.5.3 对LR(k)算法的评价 170

7.6 富田胜算法 170

7.7 自底向上的线图算法 175

7.8 自底向上与自顶向下相结合的线图分析算法 188

7.9 CYK算法 193

7.10 本章进一步讨论 194

7.11 本章小结 196

第8章 语义理论与语义分析 197

8.1 格语法 198

8.1.1 格的含义 198

8.1.2 格语法 199

8.1.3 词汇部分 200

8.1.4 转换部分 201

8.1.5 使用格语法进行语义分析:格框架约束分析技术 201

8.1.6 格语法描写汉语的局限性 204

8.2 语义网络文法 204

8.2.1 语义网络的概念 204

8.2.2 语义网络的概念关系 205

8.2.3 事件的语义网络表示 206

8.2.4 事物间语义关系 206

8.2.5 用语义网络进行推理 206

8.2.6 用语义网络来翻译 207

8.2.7 基于语义网络的汉语处理 207

8.3 义素分析法 207

8.4 优选语义学 208

8.4.1 语义元素 208

8.4.2 语义公式 209

8.4.3 语义模式 209

8.4.4 使用优选理论翻译英法句子的处理过程 209

8.4.5 优选语义学主要特点 212

8.5 蒙塔格语法 212

8.5.1 引言 212

8.5.2 MG句法部分 213

8.5.3 MG翻译部分 216

8.5.4 MG语义部分 218

8.6 本章进一步讨论 220

第9章 统计语言学 221

9.1 概率统计与信息论基础 221

9.2 语料库发展与加工技术 224

9.2.1 语料库的发展与加工 224

9.2.2 语料库的作用 227

9.3 概率语法 227

9.3.1 n元语法 228

9.3.2 隐马尔可夫模型及其应用 229

9.3.3 概率上下文无关语法及其应用 232

9.4 双语语料库中的对齐技术 237

9.4.1 基于长度的句子对齐 237

9.4.2 基于词汇的句子对齐 240

9.5 支持向量机 241

9.6 最大熵模型 244

9.7 参数平滑算法 247

9.8 本章小结 248

第10章 机器翻译 250

10.1 机器翻译的概念 250

10.2 机器翻译方法 250

10.2.1 直接翻译法(第一代机器翻译系统) 251

10.2.2 基于转换的方法 251

10.2.3 基于中间语言方法 252

10.2.4 统计机器翻译 254

10.2.5 基于实例方法 270

10.3 机器翻译难点 273

10.4 机器翻译系统采取的其他策略 276

10.5 机器翻译发展原因 277

10.6 机器翻译的应用 278

10.7 机器翻译自动评测方法 280

10.8 本章小结 282

参考文献 283