自然语言处理Python进阶PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:(印)克里希纳·巴夫萨(Krishna Bhavsar),(印)纳雷什·库马尔(Naresh Kumar),(印)普拉塔普·丹蒂(Pratap Dangeti)著
- 出 版 社:北京:机械工业出版社
- 出版年份:2019
- ISBN:9787111616436
- 页数:207 页
第1章 语料库和WordNet 1
1.1引言 1
1.2访问内置语料库 1
1.3下载外部语料库,加载并访问 3
1.4计算布朗语料库中三种不同类别的特殊疑问词 5
1.5探讨网络文本和聊天文本的词频分布 7
1.6使用WordNet进行词义消歧 9
1.7选择两个不同的同义词集,使用WordNet探讨上位词和下位词的概念 12
1.8基于WordNet计算名词、动词、形容词和副词的平均多义性 15
第2章 针对原始文本,获取源数据和规范化 17
2.1引言 17
2.2字符串操作的重要性 17
2.3深入实践字符串操作 19
2.4在Python中读取PDF文件 21
2.5在Python中读取Word文件 23
2.6使用PDF、DOCX和纯文本文件,创建用户自定义的语料库 26
2.7读取RSS信息源的内容 29
2.8使用BeautifulSoup解析HTML 31
第3章 预处理 34
3.1引言 34
3.2分词——学习使用NLTK内置的分词器 34
3.3词干提取——学习使用NLTK内置的词干提取器 36
3.4词形还原——学习使用NLTK中的WordnetLemmatizer函数 38
3.5停用词——学习使用停用词语料库及其应用 40
3.6编辑距离——编写计算两个字符串之间编辑距离的算法 42
3.7处理两篇短文并提取共有词汇 44
第4章 正则表达式 50
4.1引言 50
4.2正则表达式——学习使用*、+和? 50
4.3正则表达式——学习使用$和^,以及如何在单词内部(非开头与结尾处)进行模式匹配 52
4.4匹配多个字符串和子字符串 54
4.5学习创建日期正则表达式和一组字符集合或字符范围 56
4.6查找句子中所有长度为5的单词,并进行缩写 58
4.7学习编写基于正则表达式的分词器 59
4.8学习编写基于正则表达式的词干提取器 60
第5章 词性标注和文法 63
5.1引言 63
5.2使用内置的词性标注器 63
5.3编写你的词性标注器 65
5.4训练你的词性标注器 70
5.5学习编写你的文法 73
5.6编写基于概率的上下文无关文法 76
5.7编写递归的上下文无关文法 79
第6章 分块、句法分析、依存分析 82
6.1引言 82
6.2使用内置的分块器 82
6.3编写你的简单分块器 84
6.4训练分块器 87
6.5递归下降句法分析 90
6.6 shift-reduce句法分析 93
6.7依存句法分析和主观依存分析 95
6.8线图句法分析 97
第7章 信息抽取和文本分类 101
7.1引言 101
7.2使用内置的命名实体识别工具 102
7.3创建字典、逆序字典和使用字典 104
7.4特征集合选择 109
7.5利用分类器分割句子 113
7.6文本分类 116
7.7利用上下文进行词性标注 120
第8章 高阶自然语言处理实践 124
8.1引言 124
8.2创建一条自然语言处理管道 124
8.3解决文本相似度问题 131
8.4主题识别 136
8.5文本摘要 140
8.6指代消解 143
8.7词义消歧 147
8.8情感分析 150
8.9高阶情感分析 153
8.10创建一个对话助手或聊天机器人 157
第9章 深度学习在自然语言处理中的应用 163
9.1引言 163
9.2利用深度神经网络对电子邮件进行分类 168
9.3使用一维卷积网络进行IMDB情感分类 175
9.4基于双向LSTM的IMDB情感分类模型 179
9.5利用词向量实现高维词在二维空间的可视化 183
第10章 深度学习在自然语言处理中的高级应用 188
10.1引言 188
10.2基于莎士比亚的著作使用LSTM技术自动生成文本 188
10.3基于记忆网络的情景数据问答 193
10.4使用循环神经网络LSTM进行语言建模以预测最优词 199
10.5使用循环神经网络LSTM构建生成式聊天机器人 203
- 《自然拼读背单词 高考英语3500词》宋德伟 2019
- 《程序逻辑及C语言编程》卢卫中,杨丽芳主编 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《幼儿园课程资源丛书 幼儿园语言教育资源》周兢编 2015
- 《高等学校“十三五”规划教材 C语言程序设计》翟玉峰责任编辑;(中国)李聪,曾志华,江伟 2019
- 《音乐语言的根基》张艺编著 2019
- 《认知语言学视野的抽象方位结构研究》曹爽著 2019
- 《激活语言思维》李蒨,王宏年,汤青编著 2017
- 《自然拼读背单词 小学英语1000词》宋德伟 2019
- 《汉语言文学本科专业核心课程研究导引教材 古代汉语》马蓝婕责任编辑;(中国)魏宜辉 2019
- 《公主小姐不想吃饭》(法)克里斯汀·诺曼·维拉蒙著(法)玛丽安娜·巴尔西隆绘苏迪译 2019
- 《我才是真的公主!》(法)克里斯汀·诺曼·维拉蒙,苏迪,(法)玛丽安娜·巴 2019
- 《空气动力学 7 飘浮的秘密》(加)克里斯·费里著 2019
- 《大历史 虚无与万物之间 全彩插图版》(美)大卫·克里斯蒂安,辛西娅·斯托克斯·布朗,克雷格·本杰明著;刘耀辉译 2017
- 《什么都要可以吗?》(法)克里斯汀·诺曼·维拉蒙著;(法)玛丽安娜·巴尔西隆绘;苏迪译 2019
- 《成为自己 找回生命本来的样子》(印)克里希那穆提,司哲 2018
- 《园丁集 2019》冰心译;(印)拉宾德拉纳特·泰戈尔 2019
- 《没有疼痛的身体》杨晓晨责任编辑;秦秋林,张卫彤译;(法国)克里斯多夫·卡里奥 2019
- 《古埃及的女性》克里斯蒂安·雅克(ChristianJacq)著,孔令艳,潘宁译 2019
- 《第三帝国的兴亡》(英)克里斯·毕晓普(Chris Bishop),(英)戴维·乔丹(David Jordan)著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019