文挖掘 基于R语言的整洁工具PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:茱莉亚.斯拉格
- 出 版 社:北京:机械工业出版社
- 出版年份:2018
- ISBN:9787111588559
- 页数:162 页
前言 1
第1章 整洁文本格式 7
比较整洁文本结构与其他数据结构 8
unnest tokens函数 8
整理Jane Austen的作品 10
gutenbergr包 13
词频 13
总结 17
第2章 基于整洁数据的情感分析 18
情感数据集 18
内连接的情感分析 21
比较三个情感词典 24
最常见的正面单词和负面单词 26
Wordclouds模块 28
除单词外的其他文本单元 30
总结 32
第3章 分析词和文件频率:tf-idf 33
Jane Austen小说中的词项频率 34
Zipf定律 35
bind tf idf函数 38
物理学语料库 41
总结 45
第4章 词之间的关系:n-gram及相关性 46
n-gram词条化 46
用widyr包对单词对计数并计算相关性 60
总结 66
第5章 非整洁格式转换 67
使文档-词项矩阵整洁 67
将整洁文本数据转换为矩阵 74
总结 84
第6章 主题建模 85
LDA 86
示例:博大的图书馆馆藏 91
LDA方法的替代实现 101
总结 102
第7章 案例研究:Twitter归档文件比较 103
单词使用情况的比较 107
单词使用情况的变化 109
收藏和转发 113
总结 117
第8章 案例研究:NASA元数据挖掘 118
NASA如何组织数据 118
共现单词与相关单词 123
计算描述字段的tf-idf 129
总结 142
第9章 案例研究:分析Usenet文本 143
预处理 143
新闻组中的单词 146
情感分析 151
总结 159
参考文献 160
- 《程序逻辑及C语言编程》卢卫中,杨丽芳主编 2019
- 《幼儿园课程资源丛书 幼儿园语言教育资源》周兢编 2015
- 《高等学校“十三五”规划教材 C语言程序设计》翟玉峰责任编辑;(中国)李聪,曾志华,江伟 2019
- 《音乐语言的根基》张艺编著 2019
- 《认知语言学视野的抽象方位结构研究》曹爽著 2019
- 《激活语言思维》李蒨,王宏年,汤青编著 2017
- 《汉语言文学本科专业核心课程研究导引教材 古代汉语》马蓝婕责任编辑;(中国)魏宜辉 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《英语教师语言意识研究》秦莉,赵春贺著 2019
- 《基于多维视角的英语语言学理论探索与应用》刘曦著 2019
- 《生命拍卖》(英)安杰拉·马森斯(AngelaMarsons)著,博集天卷出品 2019
- 《电》(英)布拉格(W.L.Bragg)著;杨孝述译述 1936
- 《红与黑》(法)斯丹达尔著;郭宏安译 2019
- 《卡塞尔不欢迎逻辑》(西)恩里克·比拉-马塔斯著;施杰李,雪菲译 2019
- 《玛德琳》(美)路德维格·贝梅尔曼斯文图 2019
- 《爷爷您还好吗》魏琳琳译;(美)琳达·斯卡科 2019
- 《超图解中国哲学简史》玮丽斯责任编辑;(中国)王宇琨,董志道 2019
- 《大脑与精神简史 我们如何得知如何感受如何思考》王柄燚译;(德国)马提亚斯·埃科尔特 2019
- 《认知行为治疗的个案概念化》李飞,刘光亚,位照国译;(美国)杰奎琳·B.珀森斯 2019
- 《三大师》斯·茨威格著;张玉书译 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019