《自然语言计算机形式分析的理论与方法》PDF下载

  • 购买积分:22 如何计算积分?
  • 作  者:冯志伟著
  • 出 版 社:合肥:中国科学技术大学出版社
  • 出版年份:2017
  • ISBN:9787312041303
  • 页数:846 页
图书介绍:本书是国内第一本综述基于规则与基于统计的自然语言处理方法的专著,对自然语言处理中的各种形式模型进行了系统的梳理,分别讨论了基于短语结构语法的形式模型、基于合一运算的形式模型、基于依存和配价的形式模型、基于格语法的形式模型、基于词汇主义的形式模型、语义自动处理的形式模型、语用自动处理的形式模型、隐马尔可夫模型、统计机器翻译的形式模型。本书说理透彻、语言流畅、实例丰富、深入浅出,反映了国内外自然语言处理方面的最新成果,适合于从事自然语言处理教学和研究的科研人员、大学师生阅读,也可以作为人工智能、计算语言学等课程的教学参考。

第1章 自然语言处理的学科定位 1

1.1 从自然语言处理的过程来考察其学科定位 1

1.2 从自然语言处理的范围来考察其学科定位 6

1.3 从自然语言处理的历史来考察其学科定位 10

1.4 当前自然语言处理发展的几个特点 34

参考文献 43

第2章 语言计算研究的先驱 44

2.1 Markov链 45

2.2 Zipf定律 47

2.3 Shannon关于“熵”的研究 53

2.4 Bar-Hillel的范畴语法 62

2.5 Harris的语言串分析法 75

2.6 О.С.Кулагина的语言集合论模型 77

参考文献 81

第3章 基于短语结构语法的形式模型 83

3.1 语法的Chomsky层级 83

3.2 有限状态语法和它的局限性 88

3.3 短语结构语法 94

3.4 递归转移网络和扩充转移网络 101

3.5 自底向上分析和自顶向下分析 105

3.6 通用句法处理器和线图分析法 110

3.7 Earley算法 125

3.8 左角分析法 138

3.9 CYK算法 141

3.10 Tomita算法 146

3.11 管辖-约束理论与最简方案 151

3.12 Joshi的树邻接语法 165

3.13 汉字结构的形式描述 173

3.14 Hausser的左结合语法 185

参考文献 191

第4章 基于合一运算的形式模型 193

4.1 中文信息MMT模型 193

4.2 Kaplan的词汇功能语法 201

4.3 Martin Kay的功能合一语法 220

4.4 Gazdar的广义短语结构语法 232

4.5 Shieber的PATR 244

4.6 Pollard的中心语驱动的短语结构语法 253

4.7 Pereira和Warren的定子句语法 278

参考文献 284

第5章 基于依存和配价的形式模型 286

5.1 配价观念的起源 286

5.2 Tesnière的依存语法 287

5.3 依存语法在自然语言处理中的应用 294

5.4 配价语法 306

5.5 配价语法在自然语言处理中的应用 311

参考文献 328

第6章 基于格语法的形式模型 329

6.1 Fillmore的格语法 329

6.2 Fillmore的框架网络 342

参考文献 355

第7章 基于词汇主义的形式模型 356

7.1 Gross的词汇语法 356

7.2 链语法 362

7.3 词汇语义学 365

7.4 知识本体 369

7.5 词网 378

7.6 知网 389

7.7 Pustejovesky的生成词库理论 393

参考文献 408

第8章 语义自动处理的形式模型 410

8.1 义素分析法 410

8.2 语义场 416

8.3 语义网络 422

8.4 Montague语法 426

8.5 Wilks的优选语义学 437

8.6 Schank的概念依存理论 445

8.7 Mel'chuk的意义?文本理论 463

8.8 词义排歧方法 468

参考文献 479

第9章 系统功能语法 481

9.1 系统功能语法的基本概念 481

9.2 系统功能语法在自然语言处理中的应用 494

参考文献 499

第10章 语用自动处理的形式模型 500

10.1 Mann和Thompson的修辞结构理论 500

10.2 文本连贯中的常识推理技术 510

10.3 言语行为理论和会话智能代理 521

参考文献 552

第11章 概率语法 554

11.1 概率上下文无关语法与句子的歧义 554

11.2 概率上下文无关语法的基本原理 557

11.3 概率上下文无关语法的三个假设 562

11.4 概率词汇化上下文无关语法 566

参考文献 569

第12章 Bayes公式与动态规划算法 570

12.1 拼写错误的检查与更正 570

12.2 Bayes公式与噪声信道模型 574

12.3 最小编辑距离算法 580

12.4 发音问题研究中的Bayes方法 583

12.5 发音变异的决策树模型 591

12.6 加权自动机 592

12.7 向前算法 594

12.8 Viterbi算法 598

附录 604

参考文献 606

第13章 N元语法和数据平滑 607

13.1 N元语法 607

13.2 数据平滑 619

参考文献 632

第14章 隐Markov模型(HMM) 633

14.1 HMM概述 633

14.2 HMM在语音识别中的应用 636

参考文献 653

第15章 语音自动处理的形式模型 654

15.1 语音和音位的形式描述方法 654

15.2 声学语音学和信号 668

15.3 语音自动合成的方法 681

15.4 语音自动识别的方法 703

参考文献 720

第16章 统计机器翻译中的形式模型 723

16.1 机器翻译与噪声信道模型 723

16.2 最大熵模型 744

16.3 基于平行概率语法的形式模型 747

16.4 基于短语的统计机器翻译 754

16.5 基于句法的统计机器翻译 762

参考文献 767

第17章 自然语言处理系统的评测 770

17.1 评测的一般原则和方法 770

17.2 语音合成和文语转换系统的评测 771

17.3 机器翻译系统的评测 780

17.4 语料库系统的评测 787

17.5 国外自然语言处理系统的评测 794

参考文献 802

第18章 自然语言处理中的理性主义与经验主义 803

18.1 哲学中的理性主义和经验主义 803

18.2 自然语言处理中理性主义和经验主义的消长 805

18.3 理性主义方法和经验主义方法的利弊得失 813

18.4 探索理性主义方法和经验主义方法结合的途径 818

参考文献 820

附录 走在文理结合的道路上——记自然语言处理专家冯志伟先生 821