《自然语言处理综论 第2版》PDF下载

  • 购买积分:21 如何计算积分?
  • 作  者:(美)DanielJurafsky,JamesH.Martin著;冯志伟,孙乐译
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2018
  • ISBN:9787121250583
  • 页数:784 页
图书介绍:本书全面论述了语言技术,并在前一版基础上综合了最近几年的技术更新,将深入的语言分析和鲁棒的统计方法紧密结合。从技术角度看,本书介绍了正规表达式、信息检索、上下文无关文法、合一、一阶谓词演算、隐马尔可夫模型和其他概率模型、修辞结构理论等内容,全书将自然语言处理、计算语言学和语音识别的知识综合在一起,非常适合作为相关师生的教材和参考书。

第1章 导论 1

1.1语音与语言处理中的知识 2

1.2歧义 4

1.3模型和算法 4

1.4语言、思维和理解 6

1.5学科现状与近期发展 7

1.6语音和语言处理简史 8

1.6.1基础研究:20世纪40年代和20世纪50年代 8

1.6.2两个阵营:1957年至1970年 9

1.6.3四个范型:1970年至1983年 10

1.6.4经验主义和有限状态模型的复苏:1983年至1993年 11

1.6.5不同领域的合流:1994年至1999年 11

1.6.6机器学习的兴起:2000年至2008年 11

1.6.7关于多重发现 12

1.6.8心理学的简要注记 12

1.7小结 13

1.8文献和历史说明 13

第一部分 词汇的计算机处理 16

第2章 正则表达式与自动机 16

2.1正则表达式 16

2.1.1基本正则表达式模式 17

2.1.2析取、组合与优先关系 20

2.1.3一个简单的例子 21

2.1.4一个比较复杂的例子 21

2.1.5高级算符 22

2.1.6正则表达式中的替换、存储器与ELIZA 23

2.2有限状态自动机 24

2.2.1用FSA来识别羊的语言 24

2.2.2形式语言 27

2.2.3其他例子 28

2.2.4非确定FSA 28

2.2.5使用NFSA接收符号串 29

2.2.6识别就是搜索 32

2.2.7确定自动机与非确定自动机的关系 33

2.3正则语言与FSA 34

2.4小结 36

2.5文献和历史说明 37

第3章 词与转录机 38

3.1英语形态学概观 40

3.1.1屈折形态学 41

3.1.2派生形态学 43

3.1.3附着 43

3.1.4非毗连形态学 44

3.1.5一致关系 44

3.2有限状态形态剖析 45

3.3有限状态词表的建造 46

3.4有限状态转录机 48

3.4.1定序转录机和确定性 50

3.5用于形态剖析的FST 51

3.6转录机和正词法规则 53

3.7把FST词表与规则相结合 55

3.8与词表无关的FST:Porter词干处理器 56

3.9单词和句子的词例还原 57

3.9.1中文的自动切词 59

3.10拼写错误的检查与更正 60

3.11最小编辑距离 62

3.12人是怎样进行形态处理的 65

3.13小结 66

3.14文献和历史说明 67

第4章N元语法 69

4.1语料库中单词数目的计算 71

4.2简单的(非平滑的)N元语法 72

4.3训练集和测试集 76

4.3.1 N元语法及其对训练语料库的敏感性 77

4.3.2未知词:开放词汇与封闭词汇 79

4.4 N元语法的评测:困惑度 80

4.5平滑 82

4.5.1 Laplace平滑 82

4.5.2 Good-Turing打折法 85

4.5.3 Good-Turing估计的一些高级专题 87

4.6插值法 87

4.7回退法 88

4.7.1高级专题:计算Katz回退的α和P 90

4.8实际问题:工具包和数据格式 90

4.9语言模型建模中的高级专题 92

4.9.1高级的平滑方法:Kneser-Ney平滑法 92

4.9.2基于类别的N元语法 93

4.9.3语言模型的自适应和网络(Web)应用 94

4.9.4长距离信息的使用:简要的综述 95

4.10信息论背景 96

4.10.1用于比较模型的交叉熵 98

4.11高级问题:英语的熵和熵率均衡性 99

4.12小结 100

4.13文献和历史说明 100

第5章 词类标注 102

5.1(大多数)英语词的分类 103

5.2英语的标记集 109

5.3词类标注 114

5.4基于规则的词类标注 116

5.5基于隐马尔可夫模型的词类标注 118

5.5.1计算最可能的标记序列:一个实例 120

5.5.2隐马尔可夫标注算法的形式化 122

5.5.3使用Viterbi算法来进行HMM标注 123

5.5.4把HMM扩充到三元语法 126

5.6基于转换的标注 128

5.6.1怎样应用TBL规则 128

5.6.2怎样学习TBL规则 129

5.7评测和错误分析 131

5.7.1错误分析 132

5.8词类标注中的高级专题 133

5.8.1实际问题:标记的不确定性与词例还原 133

5.8.2未知词 134

5.8.3其他语言中的词类标注 136

5.8.4标注算法的结合 138

5.9高级专题:拼写中的噪声信道模型 138

5.9.1上下文错拼更正 142

5.10小结 143

5.11文献和历史说明 143

第6章 隐马尔可夫模型与最大熵模型 146

6.1马尔可夫链 147

6.2隐马尔可夫模型 149

6.3似然度的计算:向前算法 151

6.4解码:Viterbi算法 155

6.5 HMM的训练:向前-向后算法 158

6.6最大熵模型:背景 162

6.6.1线性回归 163

6.6.2逻辑回归 166

6.6.3逻辑回归:分类 168

6.6.4高级专题:逻辑回归的训练 168

6.7最大熵模型 169

6.7.1为什么称为最大熵 172

6.8最大熵马尔可夫模型 174

6.8.1 MEMM的解码和训练 176

6.9小结 177

6.10文献和历史说明 178

第二部分 语音的计算机处理 182

第7章 语音学 182

7.1言语语音与语音标音法 183

7.2发音语音学 184

7.2.1发音器官 184

7.2.2辅音:发音部位 186

7.2.3辅音:发音方法 186

7.2.4元音 187

7.2.5音节 188

7.3音位范畴与发音变异 190

7.3.1语音特征 192

7.3.2语音变异的预测 193

7.3.3影响语音变异的因素 193

7.4声学语音学和信号 194

7.4.1波 195

7.4.2语音的声波 195

7.4.3频率与振幅:音高和响度 197

7.4.4从波形来解释音子 199

7.4.5声谱和频域 200

7.4.6声源滤波器模型 203

7.5语音资源 204

7.6高级问题:发音音系学与姿态音系学 206

7.7小结 207

7.8文献和历史说明 208

第8章 语音合成 209

8.1文本归一化 210

8.1.1句子的词例还原 211

8.1.2非标准词 213

8.1.3同形异义词的排歧 215

8.2语音分析 216

8.2.1查词典 217

8.2.2名称 217

8.2.3字位-音位转换 218

8.3韵律分析 220

8.3.1韵律的结构 221

8.3.2韵律的突显度 222

8.3.3音调 224

8.3.4更精巧的模型:ToBI 224

8.3.5从韵律标记计算音延 226

8.3.6从韵律标记计算FO 227

8.3.7文本分析的最后结果:内部表示 228

8.4双音子波形合成 229

8.4.1建立双音子数据库的步骤 230

8.4.2双音子毗连和用于韵律的TD-PSOLA 231

8.5单元选择(波形)合成 233

8.6评测 236

8.7文献和历史说明 237

第9章 语音自动识别 240

9.1语音识别的总体结构 242

9.2隐马尔可夫模型应用于语音识别 245

9.3特征抽取:MFCC矢量 249

9.3.1预加重 249

9.3.2加窗 250

9.3.3离散傅里叶变换 251

9.3.4 Mel滤波器组和对数 252

9.3.5倒谱:逆向傅里叶变换 253

9.3.6 Delta特征与能量 254

9.3.7总结:MFCC 255

9.4声学似然度的计算 255

9.4.1矢量量化 256

9.4.2高斯概率密度函数 258

9.4.3概率、对数概率和距离函数 263

9.5词典和语言模型 264

9.6搜索与解码 265

9.7嵌入式训练 273

9.8评测:词错误率 276

9.9小结 278

9.10文献和历史说明 279

第10章 语音识别:高级专题 282

10.1多遍解码:N-最佳表和格 282

10.2 A*解码算法(“栈”解码算法) 287

10.3依赖于上下文的声学模型:三音子 291

10.4分辨训练 294

10.4.1最大互信息估计 295

10.4.2基于后验分类器的声学模型 296

10.5语音变异的建模 297

10.5.1环境语音变异和噪声 297

10.5.2说话人变异和说话人适应 297

10.5.3发音建模:由于语类的差别而产生的变异 299

10.6元数据:边界、标点符号和不流利现象 300

10.7人的语音识别 302

10.8小结 303

10.9文献和历史说明 303

第11章 计算音系学 305

11.1有限状态音系学 305

11.2高级有限状态音系学 308

11.2.1元音和谐 308

11.2.2模板式形态学 309

11.3计算优选理论 310

11.3.1优选理论中的有限状态转录机模型 312

11.3.2优选理论的随机模型 313

11.4音节切分 314

11.5音位规则和形态规则的机器学习 317

11.5.1音位规则的机器学习 317

11.5.2形态规则的机器学习 318

11.5.3优选理论中的机器学习 321

11.6小结 322

11.7文献和历史说明 322

第三部分 句法的计算机处理 325

第12章 英语的形式语法 325

12.1组成性 326

12.2上下文无关语法 327

12.2.1上下文无关语法的形式定义 330

12.3英语的一些语法规则 331

12.3.1句子一级的结构 331

12.3.2子句与句子 333

12.3.3名词短语 333

12.3.4一致关系 337

12.3.5动词短语和次范畴化 338

12.3.6助动词 340

12.3.7并列关系 340

12.4树库 341

12.4.1树库的例子:宾州树库课题 342

12.4.2作为语法的树库 343

12.4.3树库搜索 345

12.4.4中心词与中心词的发现 346

12.5语法等价与范式 348

12.6有限状态语法和上下文无关语法 349

12.7依存语法 350

12.7.1依存和中心词之间的关系 351

12.7.2范畴语法 352

12.8口语的句法 352

12.8.1不流畅现象与口语修正 353

12.8.2口语树库 354

12.9语法和人的语言处理 354

12.10小结 356

12.11文献和历史说明 356

第13章 句法剖析 359

13.1剖析就是搜索 359

13.1.1自顶向下剖析 360

13.1.2自底向上剖析 361

13.1.3自顶向下剖析与自底向上剖析比较 362

13.2歧义 362

13.3面对歧义的搜索 365

13.4动态规划剖析方法 366

13.4.1 CKY剖析 367

13.4.2 Earley算法 372

13.4.3线图剖析 376

13.5局部剖析 378

13.5.1基于规则的有限状态组块分析 379

13.5.2基于机器学习的组块分析方法 380

13.5.3组块分析系统的评测 382

13.6小结 383

13.7文献和历史说明 384

第14章 统计剖析 385

14.1概率上下文无关语法 386

14.1.1 PCFG用于排歧 387

14.1.2 PCFG用于语言建模 389

14.2 PCFG的概率CKY剖析 389

14.3 PCFG规则概率的学习途径 391

14.4 PCFG的问题 392

14.4.1独立性假设忽略了规则之间的结构依存关系 392

14.4.2缺乏对词汇依存关系的敏感性 393

14.5使用分离非终极符号的办法来改进PCFG 395

14.6概率词汇化的CFG 396

14.6.1 Collins剖析器 398

14.6.2高级问题:Collins剖析器更多的细节 399

14.7剖析器的评测 401

14.8高级问题:分辨再排序 402

14.9高级问题:基于剖析器的语言模型 403

14.10人的剖析 404

14.11小结 406

14.12文献和历史说明 407

第15章 特征与合一 409

15.1特征结构 410

15.2特征结构的合一 412

15.3语法中的特征结构 415

15.3.1一致关系 417

15.3.2中心语特征 418

15.3.3次范畴化 419

15.3.4长距离依存关系 423

15.4合一的实现 424

15.4.1合一的数据结构 424

15.4.2合一算法 426

15.5带有合一约束的剖析 429

15.5.1把合一结合到Earley剖析器中 429

15.5.2基于合一的剖析 433

15.6类型与继承 435

15.6.1高级问题:类型的扩充 437

15.6.2合一的其他扩充 438

15.7小结 438

15.8文献和历史说明 439

第16章 语言和复杂性 441

16.1 Chomsky层级 442

16.2怎么判断一种语言不是正则的 444

16.2.1抽吸引理 444

16.2.2证明各种自然语言不是正则语言 446

16.3自然语言是上下文无关的吗 448

16.4计算复杂性和人的语言处理 449

16.5小结 452

16.6文献和历史说明 452

第四部分 语义和语用的计算机处理 456

第17章 意义的表示 456

17.1意义表示的计算要求 457

17.1.1可验证性 458

17.1.2无歧义性 458

17.1.3规范形式 459

17.1.4推理与变量 460

17.1.5表达能力 460

17.2模型论语义学 461

17.3一阶逻辑 463

17.3.1一阶逻辑基础 463

17.3.2变量和量词 465

17.3.3 λ表示法 466

17.3.4一阶逻辑的语义 467

17.3.5推理 468

17.4事件与状态的表示 469

17.4.1时间表示 472

17.4.2体 474

17.5描述逻辑 476

17.6意义的具体化与情境表示方法 481

17.7小结 482

17.8文献和历史说明 482

第18章 计算语义学 484

18.1句法驱动的语义分析 484

18.2句法规则的语义扩充 486

18.3量词辖域歧义及非确定性 490

18.3.1存储与检索方法 491

18.3.2基于约束的方法 492

18.4基于合一的语义分析方法 495

18.5语义与Earley分析器的集成 499

18.6成语和组成性 500

18.7小结 501

18.8文献和历史说明 501

第19章 词汇语义学 503

19.1词义 504

19.2含义间的关系 506

19.2.1同义关系和反义关系 506

19.2.2上下位关系 507

19.2.3语义场 508

19.3 WordNet:词汇关系信息库 508

19.4事件参与者 511

19.4.1题旨角色 511

19.4.2因素交替(Diathesis Alternations) 512

19.4.3题旨角色的问题 513

19.4.4命题库 514

19.4.5 FrameNet 515

19.4.6选择限制 516

19.5基元分解 518

19.6高级问题:隐喻 520

19.7小结 521

19.8文献和历史说明 521

第20章 计算词汇语义学 523

20.1词义排歧:综述 524

20.2有监督词义排歧 525

20.2.1监督学习的特征抽取 525

20.2.2朴素贝叶斯分类器和决策表分类器 526

20.3 WSD评价方法、基准线和上限 528

20.4 WSD:字典方法和同义词库方法 530

20.4.1 Lesk算法 530

20.4.2选择限制和选择优先度 531

20.5最低限度的监督WSD:自举法 533

20.6词语相似度:语义字典方法 534

20.7词语相似度:分布方法 539

20.7.1定义词语的共现向量 540

20.7.2度量与上下文的联系 541

20.7.3定义两个向量之间的相似度 543

20.7.4评价分布式词语相似度 546

20.8下位关系和其他词语关系 546

20.9语义角色标注 549

20.10高级主题:无监督语义排歧 551

20.11小结 553

20.12文献和历史说明 553

第21章 计算话语学 556

21.1话语分割 558

21.1.1无监督话语分割 559

21.1.2有监督话语分割 561

21.1.3话语分割的评价 562

21.2文本连贯性 562

21.2.1修辞结构理论 564

21.2.2自动连贯指派 565

21.3指代消解 567

21.4指代现象 570

21.4.1指示语的五种类型 570

21.4.2信息状态 571

21.5代词指代消解所使用的特征 573

21.5.1用来过滤潜在指代对象的特征 573

21.5.2代词解释中的优先关系 574

21.6指代消解的三种算法 575

21.6.1代词指代基准系统:Hobbs算法 575

21.6.2指代消解的中心算法 576

21.6.3代词指代消解的对数线性模型 579

21.6.4代词指代消解的特征 579

21.7共指消解 580

21.8共指消解的评价 582

21.9高级问题:基于推理的连贯判定 582

21.10所指的心理语言学研究 586

21.11小结 587

21.12文献和历史说明 588

第五部分 应用 592

第22章 信息抽取 592

22.1命名实体识别 594

22.1.1命名实体识别中的歧义 595

22.1.2基于序列标注的命名实体识别 596

22.1.3命名实体识别的评价 599

22.1.4实用NER架构 599

22.2关系识别和分类 599

22.2.1用于关系分析的有监督学习方法 600

22.2.2用于关系分析的弱监督学习方法 603

22.2.3关系分析系统的评价 605

22.3时间和事件处理 606

22.3.1时间表达式的识别 606

22.3.2时间的归一化 609

22.3.3事件检测和分析 611

22.3.4 TimeBank 612

22.4模板填充 613

22.4.1模板填充的统计方法 614

22.4.2有限状态机模板填充系统 614

22.5高级话题:生物医学信息的抽取 617

22.5.1生物学命名实体识别 618

22.5.2基因归一化 619

22.5.3生物学角色和关系 619

22.6小结 621

22.7文献和历史说明 621

第23章 问答和摘要 623

23.1信息检索 625

23.1.1向量空间模型 626

23.1.2词语权重计算 627

23.1.3词语选择和建立 628

23.1.4信息检索系统的评测 629

23.1.5同形关系、多义关系和同义关系 631

23.1.6改进用户查询的方法 631

23.2事实性问答 632

23.2.1问题处理 634

23.2.2段落检索 637

23.2.3答案处理 637

23.2.4事实性答案的评价 640

23.3摘要 640

23.4单文档摘要 642

23.4.1无监督的内容选择 642

23.4.2基于修辞分析的无监督摘要 644

23.4.3有监督的内容选择 645

23.4.4句子简化 646

23.5多文档摘要 647

23.5.1多文档摘要的内容选择 647

23.5.2多文档摘要的信息排序 648

23.6主题摘要和问答 651

23.7摘要的评价 653

23.8小结 655

23.9文献和历史说明 656

第24章 对话与会话智能代理 658

24.1人类会话的属性 660

24.1.1话轮和话轮转换 660

24.1.2语言作为行动:言语行为 661

24.1.3语言作为共同行动:对话的共同基础 662

24.1.4会话结构 664

24.1.5会话隐含 665

24.2基本的对话系统 666

24.2.1 ASR组件 666

24.2.2 NLU组件 667

24.2.3生成和TTS组件 669

24.2.4对话管理器 671

24.2.5错误处理:确认和拒绝 674

24.3 VoiceXML 675

24.4对话系统的设计和评价 678

24.4.1设计对话系统 678

24.4.2评价对话系统 679

24.5信息状态和对话行为 680

24.5.1使用对话行为 681

24.5.2解释对话行为 682

24.5.3检测纠正行为 685

24.5.4生成对话行为:确认和拒绝 686

24.6马尔可夫决策过程架构 687

24.7高级问题:基于规划的对话行为 689

24.7.1规划推理解释和生成 690

24.7.2对话的意图结构 692

24.8小结 694

24.9文献和历史说明 694

第25章 机器翻译 696

25.1为什么机器翻译如此困难 699

25.1.1类型学 699

25.1.2其他的结构差异 701

25.1.3词汇的差异 701

25.2经典的机器翻译方法与Vauquois三角形 702

25.2.1直接翻译 703

25.2.2转换方法 705

25.2.3传统机器翻译系统中的直接和转换相融合的方法 707

25.2.4中间语言的思想:使用意义 707

25.3统计机器翻译 709

25.4 P(F|E):基于短语的翻译模型 710

25.5翻译中的对齐 712

25.5.1 IBM模型1 714

25.5.2 HMM对齐 715

25.6对齐模型的训练 717

25.6.1训练对齐模型的EM算法 717

25.7用于基于短语机器翻译的对称对齐 719

25.8基于短语统计机器翻译的解码 721

25.9机器翻译评价 724

25.9.1使用人工评价者 724

25.9.2自动评价:BLEU 725

25.10高级问题:机器翻译的句法模型 727

25.11高级问题:IBM模型3和繁衍度 728

25.11.1模型3的训练 731

25.12高级问题:机器翻译的对数线性模型 731

25.13小结 732

25.14文献和历史说明 733

参考文献 735