自然语言处理原理与技术实现PDF电子书下载
- 电子书积分:14 积分如何计算积分?
- 作 者:罗刚,张子宪编著
- 出 版 社:北京:电子工业出版社
- 出版年份:2016
- ISBN:9787121286209
- 页数:432 页
第1章 应用自然语言处理技术 1
1.1 付出与回报 2
1.1.1 如何开始 2
1.1.2 招聘人员 2
1.1.3 学习 3
1.2 开发环境 3
1.3 技术基础 4
1.3.1 Java 4
1.3.2 规则方法 5
1.3.3 统计方法 5
1.3.4 计算框架 5
1.3.5 文本挖掘 7
1.3.6 语义库 7
1.4 本章小结 9
1.5 专业术语 9
第2章 中文分词原理与实现 11
2.1 接口 12
2.1.1 切分方案 13
2.1.2 词特征 13
2.2 查找词典算法 13
2.2.1标准Trie树 14
2.2.2 三叉Trie树 18
2.2.3 词典格式 26
2.3 最长匹配中文分词 27
2.3.1 正向最大长度匹配法 28
2.3.2 逆向最大长度匹配法 33
2.3.3 处理未登录串 39
2.3.4 开发分词 43
2.4 概率语言模型的分词方法 45
2.4.1 一元模型 47
2.4.2 整合基于规则的方法 54
2.4.3 表示切分词图 55
2.4.4 形成切分词图 62
2.4.5 数据基础 64
2.4.6 改进一元模型 75
2.4.7 二元词典 79
2.4.8 完全二叉树组 85
2.4.9 三元词典 89
2.4.10 N元模型 90
2.4.11 N元分词 91
2.4.12 生成语言模型 99
2.4.13 评估语言模型 100
2.4.14 概率分词的流程与结构 101
2.4.15 可变长N元分词 102
2.4.16 条件随机场 103
2.5 新词发现 103
2.5.1 成词规则 109
2.6 词性标注 109
2.6.1 数据基础 114
2.6.2 隐马尔可夫模型 115
2.6.3 存储数据 124
2.6.4 统计数据 131
2.6.5 整合切分与词性标注 133
2.6.6 大词表 138
2.6.7 词性序列 138
2.6.8 基于转换的错误学习方法 138
2.6.9 条件随机场 141
2.7 词类模型 142
2.8 未登录词识别 144
2.8.1 未登录人名 144
2.8.2 提取候选人名 145
2.8.3 最长人名切分 153
2.8.4 一元概率人名切分 153
2.8.5 二元概率人名切分 156
2.8.6 未登录地名 159
2.8.7 未登录企业名 160
2.9 平滑算法 160
2.10 机器学习的方法 164
2.10.1 最大熵 165
2.10.2 条件随机场 170
2.11 有限状态机 171
2.12 地名切分 178
2.12.1识别未登录地名 179
2.12.2 整体流程 185
2.13 企业名切分 187
2.13.1 识别未登录词 188
2.13.2 整体流程 190
2.14 结果评测 190
2.15 本章小结 191
2.16 专业术语 193
第3章 英文分析 194
3.1 分词 194
3.1.1 句子切分 194
3.1.2 识别未登录串 197
3.1.3 切分边界 198
3.2 词性标注 199
3.3 重点词汇 202
3.4 句子时态 203
3.5 本章小结 204
第4章 依存文法分析 205
4.1 句法分析树 205
4.2 依存文法 211
4.2.1中文依存文法 211
4.2.2 英文依存文法 220
4.2.3 生成依存树 232
4.2.4 遍历 235
4.2.5 机器学习的方法 237
4.3 小结 237
4.4 专业术语 238
第5章 文档排重 239
5.1 相似度计算 239
5.1.1 夹角余弦 239
5.1.2 最长公共子串 242
5.1.3 同义词替换 246
5.1.4 地名相似度 248
5.1.5 企业名相似度 251
5.2 文档排重 251
5.2.1关键词排重 251
5.2.2 SimHash 254
5.2.3 分布式文档排重 268
5.2.4 使用文本排重 269
5.3 在搜索引擎中使用文本排重 269
5.4 本章小结 270
5.5 专业术语 270
第6章 信息提取 271
6.1 指代消解 271
6.2 中文关键词提取 273
6.2.1关键词提取的基本方法 273
6.2.2 HITS算法应用于关键词提取 275
6.2.3 从网页中提取关键词 277
6.3 信息提取 278
6.3.1 提取联系方式 280
6.3.2 从互联网提取信息 281
6.3.3 提取地名 282
6.4 拼写纠错 283
6.4.1 模糊匹配问题 285
6.4.2 正确词表 296
6.4.3 英文拼写检查 298
6.4.4 中文拼写检查 300
6.5 输入提示 302
6.6 本章小结 303
6.7 专业术语 303
第7章 自动摘要 304
7.1 自动摘要技术 305
7.1.1 英文文本摘要 307
7.1.2 中文文本摘要 309
7.1.3 基于篇章结构的自动摘要 314
7.1.4 句子压缩 314
7.2 指代消解 314
7.3 Lucene中的动态摘要 314
7.4 本章小结 317
7.5 专业术语 318
第8章 文本分类 319
8.1 地名分类 321
8.2 错误类型分类 321
8.3 特征提取 322
8.4 关键词加权法 326
8.5 朴素贝叶斯 330
8.6 贝叶斯文本分类 336
8.7 支持向量机 336
8.7.1 多级分类 345
8.7.2 规则方法 347
8.7.3 网页分类 350
8.8 最大熵 351
8.9 信息审查 352
8.10 文本聚类 353
8.10.1 K均值聚类方法 353
8.10.2 K均值实现 355
8.10.3 深入理解DBScan算法 359
8.10.4 使用DBScan算法聚类实例 361
8.11 本章小结 363
8.12 专业术语 363
第9章 文本倾向性分析 364
9.1 确定词语的褒贬倾向 367
9.2 实现情感识别 368
9.3 本章小结 372
9.4 专业术语 373
第10章 问答系统 374
10.1 问答系统的结构 375
10.1.1 提取问答对 376
10.1.2 等价问题 376
10.2 问句分析 377
10.2.1问题类型 377
10.2.2 句型 381
10.2.3 业务类型 381
10.2.4 依存树 381
10.2.5 指代消解 383
10.2.6 二元关系 383
10.2.7 逻辑表示 386
10.2.8 问句模板 386
10.2.9 结构化问句模板 389
10.2.10检索方式 390
10.2.11问题重写 395
10.2.12提取事实 395
10.2.13验证答案 398
10.2.14无答案的处理 398
10.3 知识库 398
10.4 聊天机器人 399
10.4.1 交互式问答 401
10.4.2 垂直领域问答系统 402
10.4.3 语料库 405
10.4.4 客户端 405
10.5 自然语言生成 405
10.6 依存句法 406
10.7 提取同义词 410
10.7.1 流程 410
10.8 本章小结 411
10.9 术语表 412
第11章 语音识别 413
11.1 总体结构 414
11.1.1 识别中文 416
11.1.2 自动问答 417
11.2 语音库 418
11.3 语音合成 419
11.3.1 归一化 420
11.4 语音 420
11.4.1 标注 424
11.4.2 相似度 424
11.5 Sphinx 424
11.5.1 中文训练集 426
11.6 Julius 429
11.7 本章小结 429
11.8 术语表 429
参考资源 430
后记 431
- 《自然拼读背单词 高考英语3500词》宋德伟 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《计算机组成原理解题参考 第7版》张基温 2017
- 《程序逻辑及C语言编程》卢卫中,杨丽芳主编 2019
- 《高等院校保险学专业系列教材 保险学原理与实务》林佳依责任编辑;(中国)牟晓伟,李彤宇 2019
- 《幼儿园课程资源丛书 幼儿园语言教育资源》周兢编 2015
- 《刑法归责原理的规范化展开》陈璇著 2019
- 《教师教育系列教材 心理学原理与应用 第2版 视频版》郑红,倪嘉波,刘亨荣编;陈冬梅责编 2020
- 《妈妈365天英语》(韩)申艺莉著 2014
- 《单片机原理及应用》庄友谊 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《电子测量与仪器》人力资源和社会保障部教材办公室组织编写 2009
- 《少儿电子琴入门教程 双色图解版》灌木文化 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《通信电子电路原理及仿真设计》叶建芳 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《电子应用技术项目教程 第3版》王彰云 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017