数据科学 R语言实现PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:丘佑玮著
- 出 版 社:北京:机械工业出版社
- 出版年份:2017
- ISBN:9787111568315
- 页数:310 页
第1章 R中的函数 1
1.1引言 1
1.2创建R函数 2
1.3 匹配参数 3
1.4理解环境 5
1.5使用词法域 8
1.6理解闭包 10
1.7执行延迟计算 12
1.8创建中缀操作符 13
1.9使用替代函数 15
1.10处理函数中的错误 17
1.11调试函数 21
第2章 数据抽取、转换和加载 28
2.1引言 28
2.2下载公开数据 28
2.3读取和写入CSV文件 31
2.4扫描文本文件 32
2.5使用Excel文件 34
2.6从数据库中读取数据 36
2.7爬取网络数据 38
2.8获取Facebook数据 44
2.9使用twitteR 49
第3章 数据预处理和准备 53
3.1引言 53
3.2重命名数据变量 53
3.3转换数据类型 55
3.4使用日期格式 57
3.5添加新的记录 58
3.6过滤数据 60
3.7舍弃数据 63
3.8合并数据 64
3.9排列数据 65
3.10重塑数据 67
3.11检测缺失数据 69
3.12估计缺失数据 71
第4章 数据操作 74
4.1引言 74
4.2使用data.table加强data.frame 74
4.3使用data.table管理数据 77
4.4使用data.table执行快速聚合 82
4.5使用data.table合并大型数据集 85
4.6使用dplyr进行数据抽取和切片 88
4.7使用dplyr进行数据抽样 91
4.8使用dplyr选取列 92
4.9使用dplyr进行链式操作 94
4.10使用dplyr整理行 95
4.11使用dplyr消除重复行 97
4.12使用dplyr添加新列 98
4.13使用dplyr汇总数据 99
4.14使用dplyr合并数据 102
第5章 使用ggplot2可视化数据 105
5.1引言 105
5.2使用ggplot2创建基础图形 106
5.3改变美学映射 109
5.4引入几何对象 112
5.5执行变换 116
5.6调整图形尺度 118
5.7分面 120
5.8调整主题 122
5.9组合图形 124
5.10创建地图 126
第6章 制作交互式报告 131
6.1引言 131
6.2创建R Markdown报告 131
6.3学习markdown语法 135
6.4嵌入R代码块 137
6.5使用ggvis创建交互式图形 140
6.6理解基础语法 143
6.7控制坐标轴和图例 148
6.8使用尺度 153
6.9给ggvis图形添加交互 154
6.10创建R Shiny文档 159
6.11发布R Shiny报告 164
第7章 概率分布模拟 169
7.1引言 169
7.2生成随机样本 169
7.3理解均匀分布 171
7.4生成二项随机变量 173
7.5生成泊松随机变量 175
7.6从正态分布中抽样 177
7.7从卡方分布中抽样 183
7.8理解学生t-分布 185
7.9从数据集中抽样 187
7.10模拟随机过程 188
第8章 R中的统计推断 191
8.1引言 191
8.2获取置信区间 191
8.3执行Z-检验 196
8.4执行学生T-检验 199
8.5执行精确二项检验 202
8.6执行Kolmogorov-Smimov检验 203
8.7使用Pearson卡方检验 205
8.8理解Wilcoxon秩和检验 207
8.9执行单因素方差分析 209
8.10执行双因素方差分析 212
第9章 R语言规则和模式挖掘 216
9.1引言 216
9.2把数据转换为事务 216
9.3展示事务和关联 218
9.4使用Apriori规则挖掘关联关系 220
9.5对冗余规则剪枝 223
9.6可视化关联规则 224
9.7使用Eclat挖掘频繁项集 226
9.8使用时序信息创建事务 228
9.9使用cSPADE挖掘频繁序列模式 231
第10章 R语言时间序列挖掘 235
10.1引言 235
10.2创建时间序列数据 235
10.3绘制时间序列对象 238
10.4分解时间序列 241
10.5平滑时间序列 243
10.6预测时间序列 247
10.7选取ARIMA模型 251
10.8创建ARIMA模型 255
10.9使用ARIMA模型预测 257
10.10使用ARIMA模型预测股票价格 260
第11章 监督式机器学习 264
11.1引言 264
11.2使用1m拟合线性回归模型 264
11.3汇总线性模型拟合 266
11.4使用线性回归来预测未知值 268
11.5度量回归模型的性能 270
11.6执行多元回归分析 272
11.7使用逐步回归选取最优拟合回归模型 274
11.8应用高斯模型泛化线性回归 276
11.9执行逻辑斯谛回归分析 277
11.10使用递归分割树构建分类模型 280
11.11可视化递归分割树 282
11.12使用混淆矩阵度量模型性能 283
11.13使用ROCR度量预测性能 285
第12章 非监督式机器学习 288
12.1引言 288
12.2使用层次聚类法对数据聚类 288
12.3切割树成聚类 291
12.4使用k-means方法对数据聚类 293
12.5使用基于密度的方法对数据聚类 294
12.6从聚类中抽取轮廓信息 296
12.7比较多种聚类方法 298
12.8使用基于密度的聚类识别数字 299
12.9使用k-means聚类方法分组相似文本文档 301
12.10使用主成分分析法进行数据降维 303
12.11使用陡坡图确定主成分数量 305
12.12使用Kaiser方法确定主成分数量 306
12.13使用双标图可视化多变元数据 308
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《程序逻辑及C语言编程》卢卫中,杨丽芳主编 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《中医骨伤科学》赵文海,张俐,温建民著 2017
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《美国小学分级阅读 二级D 地球科学&物质科学》本书编委会 2016
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《汉语口语测试评分员评价研究》黄霆玮著 2019
- 《爱情故事》张佳玮著 2019
- 《这一生,从平凡到卓越》缪玮著 2019
- 《大地上雪浴的女人》施玮著 1993
- 《代表作和被代表作》张佳玮著 2013
- 《“上火”的凉茶 解密加多宝和王老吉的营销之战》陈玮著 2013
- 《危险的动植物》任桑甲,余玮著 2013
- 《徐兆玮日记 1》(清)徐兆玮著;李向东,包岐峰,苏醒等标点 2013
- 《徐兆玮日记 5》(清)徐兆玮著;李向东,包岐峰,苏醒等标点 2013
- 《张佳玮 莫奈和他的眼睛》张佳玮著 2014
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019