R数据科学实战 工具详解与案例分析PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:(中国)邬书豪,刘健
- 出 版 社:北京:机械工业出版社
- 出版年份:2019
- ISBN:9787111629948
- 页数:242 页
第一部分 工具包篇 2
第1章 数据导入工具 2
1.1 utils——数据读取基本功 3
1.1.1 read.csv/csv2——逗号分隔数据读取 3
1.1.2 read.delim/delim2——特定分隔符数据读取 6
1.1.3 read.table——任意分隔符数据读取 7
1.2 readr——进阶数据读取 15
1.3 utils vs readr——你喜欢哪个? 17
1.4 readxl——Excel文件读取 18
1.5 DBI——数据库数据查询、下载 21
1.6 pdftools——PDF文件 22
1.7 jsonlite——JSON文件 25
1.8 foreign package统计软件数据 26
1.9 本章小结 27
第2章 数据清理工具 28
2.1 基本概念 29
2.2 tibble包——数据集准备 31
2.2.1 为什么使用tibble 32
2.2.2 创建tbl格式 34
2.2.3 as tibble——转换已有格式的数据集 34
2.2.4 add row/column——实用小工具 37
2.3 tidyr——数据清道夫 40
2.3.1 为什么使用tidyr 40
2.3.2 gather/spread——“长”“宽”数据转换 40
2.3.3 separate/unite——拆分合并列 43
2.3.4 replace_ na/drop_ na/——默认值处理工具 44
2.3.5 fill/complete——填坑神器 44
2.3.6 separate_rows/nest/unest——行数据处理 45
2.4 lubridate日期时间处理 47
2.4.1 为什么使用lubridate 47
2.4.2 ymd/ymd_ hms——年月日还是日月年? 48
2.4.3 year/month/week/day/hour/minute/second——时间单位提取 49
2.4.4 guess_formats/parse_date time——时间日期格式分析 49
2.5 stringr字符处理工具 51
2.5.1 baseR vs stringr 51
2.5.2 正则表达式基础 53
2.5.3 简易正则表达式创建 54
2.5.4 文本挖掘浅析 55
第3章 数据计算工具 58
3.1 baseR计算工具概览 59
3.1.1 基本数学函数 59
3.1.2 基本运算符号 61
3.1.3 基本统计函数 62
3.2 dplyr包实战技巧 63
3.2.1 常见实用函数中英对照 63
3.2.2 dplyr行(Row)数据处理 64
3.2.3 dplyr列(Column)数据处理 73
3.3 文本挖掘实操 88
第4章 基本循环——loops和apply 92
4.1 for循环 93
4.1.1 基本概念 93
4.1.2 基本构建过程 94
4.1.3 简单应用 97
4.2 while循环 98
4.2.1 基本概念 98
4.2.2 基本构建过程 99
4.2.3 简单应用 100
4.3 “apply”函数家族 102
4.3.1 lapply——“线性”数据迭代 103
4.3.2 sapply——简约而不简单 106
4.3.3 apply——多维数据处理利器 107
4.3.4 vapply——迭代的安全模式 109
4.3.5 rapply——多层列表数据处理 112
4.3.6 mapply——对多个列表进行函数运算 115
第5章 优雅的循环——purrr包 119
5.1 map函数家族 120
5.1.1 map——对单一元素进行迭代运算 120
5.1.2 map2和pmap——对两个及以上元素进行迭代运算 125
5.1.3 imap——变量名称或位置迭代 128
5.1.4 lmap——对列表型数据中的列表元素进行迭代运算 130
5.1.5 invoke_map——对多个元素进行多个函数的迭代运算 131
5.2 探测函数群 134
5.2.1 detect/detect index——寻找第一个匹配条件的值 134
5.2.2 every/some——列表中是否全部或部分元素满足条件? 136
5.2.3 has_element——向量中是否存在想要的元素? 137
5.2.4 head/tail while——满足条件之前和之后的元素 138
5.2.5 keep/discard/com-pact——有条件筛选 139
5.2.6 prepend——随意插入数据 141
5.3 向量操纵工具箱 142
5.3.1 accumulate和reduce家族——元素累积运算 142
5.3.2 其他工具函数 143
5.4 其他实用函数 144
5.4.1 set_names——命名向量中的元素 144
5.4.2 vec_depth——嵌套列表型数据探测器 148
5.5 循环读取、清理和计算 149
第6章 data.table——超级“瑞士军刀” 152
6.1 data.table简介 152
6.2 基本函数 153
6.2.1 fread——速读 153
6.2.2 DT[i,j,by]——数据处理句式基本结构 158
6.2.3 “:=”——急速修改数值 162
6.2.4 fwrite——速写,数据输出 165
6.3 进阶应用 167
6.3.1 有条件的急速行筛选 168
6.3.2 列选择的多种可能 171
6.3.3 批量处理列及列的分裂与合并 173
6.3.4 合并数据集 176
6.3.5 “长宽”数据置换 177
6.3.6 计算分析 178
第二部分 案例篇 182
第7章 数据科学从业者调查分析 182
7.1 案例背景及变量介绍 182
7.2 简单数据清洗 183
7.3 数据科学从业者探索性数据分析 186
7.4 封装绘图函数 189
7.5 通过柱状图进行探索性分析数据 190
7.6 未来将会学习的机器学习工具 193
7.7 明年将学习的机器学习方法 194
第8章 共享单车租用频次分析 198
8.1 案例简介 198
8.2 数据准备及描述性统计分析 199
8.3 数据重塑 201
8.4 柱状图在数据分析中的简单应用 202
8.5 柱状和扇形图在数据分析中的运用 204
8.6 折线图在数据分析中的运用 207
8.7 相关系数图综合分析 209
第9章 星巴克商业案例分析 211
9.1 案例背景介绍及变量介绍 211
9.2 数据描述性统计量分析 212
9.3 数据统计分析 213
第10章 学生成绩水平分析 220
10.1 数据集 220
10.2 探索性数据分析 229
第11章 YouTube视频观看分析 234
11.1 案例背景及相关内容介绍 234
11.2 探索性数据分析 237
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《分析化学》陈怀侠主编 2019
- 《Maya 2018完全实战技术手册》来阳编著 2019
- 《高等数学试题与详解》西安电子科技大学高等数学教学团队 2019
- 《Python3从入门到实战》董洪伟 2019
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《中医女科十大名著 济阴纲目 大字本》(明)武之望著 2012
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《国学经典诵读》(中国)严琼燕 2019
- 《思维导图 超好用英语单词书》(中国)王若琳 2019
- 《东北民歌文化研究及艺术探析》(中国)杨清波 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《两京烟云》陈诗泳,赖秀俞责任编辑;(中国)千慧 2019
- 《HTML5从入门到精通 第3版》(中国)明日科技 2019
- 《MBA大师.2020年MBAMPAMPAcc管理类联考专用辅导教材 数学考点精讲》(中国)董璞 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《2013数学奥林匹克试题集锦 走向IMO》2013年IMO中国国家集训队教练组编 2013
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019