《数理语言学》PDF下载

  • 购买积分:15 如何计算积分?
  • 作  者:冯志伟,胡凤国著
  • 出 版 社:北京:商务印书馆
  • 出版年份:2012
  • ISBN:9787100083911
  • 页数:491 页
图书介绍:数理语言学主要包括代数语言学、统计语言学、应用数理语言学三个部分,本书系统地、全面地、深入浅出地介绍这三个部分的基本知识。

第1章 离散数学与语言 1

1.1 逻辑与集合 1

1.1.1 逻辑语言 1

1.1.2 英语辅音和集合论的基本概念 12

1.1.3 集合的几种记法,空集,通集 15

1.1.4 对立与集合运算 17

1.2 函数与关系 23

1.2.1 函数与关系的基本概念 23

1.2.2 关系的性质 29

1.2.3 等价关系 35

1.2.4 偏序关系和全序关系 38

1.3 成分结构树 41

1.3.1 支配关系 43

1.3.2 前于关系 45

1.3.3 标记 46

1.3.4 成分结构树的几个性质 47

1.3.5 属于,句友和统率 48

1.4 代数结构 50

1.4.1 运算 50

1.4.2 运算的性质 52

1.4.3 包含运算的代数系统 57

1.4.4 群和子群 58

1.4.5 幺半群和子幺半群 62

1.4.6 半群 64

1.4.7 符号串 65

1.4.8 毗连 66

1.4.9 语言是词的集合上的自由幺半群 67

1.5 递归 69

1.5.1 递归定义 69

1.5.2 归纳 73

1.5.3 公理系统 75

1.5.4 扩展公理系统 78

1.5.5 半图厄系统 80

第2章 代数语言学 83

2.1 形式文法和转换文法 83

2.1.1 形式文法的概念 83

2.1.2 形式文法的类型 89

2.1.3 有限状态文法 92

2.1.4 上下文无关文法 100

2.1.5 上下文有关文法和0型文法 120

2.1.6 上下文无关文法在描写自然语言方面的缺陷 130

2.1.7 转换文法的数学模型 132

2.1.8 MMT模型对于上下文无关文法的改进 137

2.2 自动机 151

2.2.1 自动机与文法的关系 151

2.2.2 有限自动机 152

2.2.3 图灵机 155

2.2.4 后进先出自动机 158

2.2.5 线性有界自动机 163

2.2.6 自动机在自然语言处理中的作用及其局限 166

2.3 语言的集合论模型 168

2.3.1 集合论模型的三个初始概念 168

2.3.2 B-划分 169

2.3.3 B-结构 170

2.3.4 B-等价 171

2.3.5 型和词类 172

2.3.6 简单语言 173

2.3.7 B-构形 176

2.3.8 名词的语法性 180

2.3.9 语言集合论模型的效用 183

2.4 句法类型演算 186

2.4.1 句法类型 186

2.4.2 句法类型演算规则 189

2.4.3 动词短语的句法类型演算 194

2.5 蒙德鸠文法 202

2.5.1 蒙德鸠文法的两个来源 202

2.5.2 深层结构与表层结构 203

2.5.3 深层结构的内涵逻辑表达式 205

2.5.4 蒙德鸠文法的语义理论 214

2.6 树邻接文法 214

2.6.1 树邻接文法的基本组成要素 216

2.6.2 接插 218

2.6.3 替换 220

2.6.4 推导关系树 221

2.6.5 卷绕操作 226

2.6.6 树集合的定义和属性 229

2.6.7 串语言的定义和属性 229

2.6.8 词汇化树邻接文法 231

第3章 统计语言学 236

3.1 统计语言学的基本概念 236

3.1.1 必然事件和随机事件 236

3.1.2 频率和概率 237

3.1.3 抽样 241

3.1.4 分布率 247

3.1.5 使用度 249

3.1.6 通用度和t阶频率 250

3.1.7 均根匀度 255

3.2 语言成分的统计研究 258

3.2.1 频率词典的编写 258

3.2.2 词的频率分布规律 264

3.2.3 Yule图和Fuchs公式 273

3.2.4 计算机词语统计研究 275

3.2.5 词汇增幅率研究 280

3.3 语料库的建设 288

3.3.1 国外的语料库建设 290

3.3.2 国内的语料库建设 294

3.4 基于语料库的语言统计研究 311

3.4.1 依存树库的建设 311

3.4.2 概率配价模式 315

3.4.3 基于树库的语言类型学研究 322

3.4.4 语言复杂网络的研究 330

3.5 语言与信息 336

3.5.1 语言的使用是一个随机过程 336

3.5.2 熵和多余度 344

第4章 应用数理语言学 353

4.1 信息语和通用网络语言 353

4.1.1 信息语的概念 353

4.1.2 信息语的设计方法 354

4.1.3 通用网络语言 356

4.2 信息检索 357

4.2.1 信息检索概述 357

4.2.2 信息检索中的文档处理 366

4.2.3 信息检索中的统计匹配技术 369

4.3 语言自动处理方法的研究 372

4.3.1 预示分析法 372

4.3.2 扩充转移网络 385

4.3.3 通用句法生成器 390

4.3.4 文本的自动生成方法 394

4.4 机器翻译 402

4.4.1 机器翻译概述 402

4.4.2 英汉机器翻译系统 404

4.4.3 汉-法、英、日、俄、德多语言机器翻译系统 409

4.4.4 机器翻译的新发展 421

4.4.4.1 基于语料库的机器翻译系统 423

4.4.4.2 互联网机器翻译 436

4.4.4.3 译者的辅助工具 437

4.5 自然语言理解 441

4.5.1 SAD-SAM系统 441

4.5.2 BASEBALL系统 442

4.5.3 SIR系统 443

4.5.4 STUDENT系统 447

4.5.5 LUNAR系统 449

4.5.6 SHRDLU系统 451

4.5.7 MARGIE系统 455

4.5.8 SAM和PAM系统 461

4.5.9 FRUMP,IPP和TALE-SPIN系统 472

4.5.10 RJD-80汉语人机对话系统 478

4.5.11 ELIZA英语人机对话系统 480

结语 484

附录:胡耀邦同志鼓励我研究数理语言学 488