数据分析与决策技术丛书 R数据分析秘笈PDF电子书下载
- 电子书积分:11 积分如何计算积分?
- 作 者:(美)维西瓦·维斯瓦纳坦,珊蒂·维斯瓦纳坦著;鱼翔译
- 出 版 社:北京:机械工业出版社
- 出版年份:2016
- ISBN:7111531736
- 页数:258 页
第1章 获取并准备好材料——数据 1
1.1 引言 1
1.2 从csv文件中读取数据 1
1.3 读取XML数据 4
1.4 读取JSON数据 6
1.5 从定宽格式文件中读取数据 7
1.6 从R数据文件和R库中读取数据 8
1.7 删除带有缺失值的样本 10
1.8 用均值填充缺失值 11
1.9 删除重复样本 13
1.10 将变量缩放至[0,1]区间 14
1.11 对数据框中的数据做正则化或标准化 15
1.12 为数值数据分箱 17
1.13 为分类变量创建哑变量 18
第2章 那里面有什么——探索性数据分析 21
2.1 引言 21
2.2 创建标准化数据概览 21
2.3 抽取数据集的子集 23
2.4 分割数据集 25
2.5 创建随机数据分块 26
2.6 创建直方图、箱线图、散点图等标准化图像 29
2.7 在网格窗口上创建多个图像 37
2.8 选择图形设备 38
2.9 用lattice包绘图 39
2.10 用ggplot2包绘图 42
2.11 创建便于比较的图表 47
2.12 创建有助于发现因果关系的图表 51
2.13 创建多元图像 53
第3章 它属于哪儿——分类技术 55
3.1 引言 55
3.2 创建误差/分类-混淆矩阵 55
3.3 创建ROC图 58
3.4 构建、绘制和评估——分类树 61
3.5 用随机森林模型分类 66
3.6 用支持向量机分类 69
3.7 用朴素贝叶斯分类 72
3.8 用K最近邻分类 74
3.9 用神经网络分类 77
3.10 用线性判别函数分类 79
3.11 用逻辑回归分类 80
3.12 用AdaBoost来整合分类树模型 83
第4章 给我一个数——回归分析 86
4.1 引言 86
4.2 计算均方根误差 86
4.3 建立用于回归的KNN模型 88
4.4 运用线性回归 94
4.5 在线性回归中运用变量选择 99
4.6 建立回归树 102
4.7 建立用于回归的随机森林模型 108
4.8 用神经网络做回归 112
4.9 运用K-折交叉验证 114
4.10 运用留一交叉验证来限制过度拟合 116
第5章 你能化简它吗——数据简化技术 118
5.1 引言 118
5.2 用K-均值聚类法实现聚类分析 118
5.3 用系统聚类法实现聚类分析 124
5.4 用主成分分析降低维度 127
第6章 从历史中学习——时间序列分析 134
6.1 引言 134
6.2 创建并检查日期对象 134
6.3 对日期对象进行操作 138
6.4 对时间序列数据做初步分析 140
6.5 使用时间序列对象 143
6.6 分解时间序列 149
6.7 对时间序列数据做滤波 151
6.8 用HoltWinters方法实现平滑和预测 152
6.9 创建自动的ARIMA模型 155
第7章 这都是你的关系——社交网络分析 157
7.1 引言 157
7.2 通过公共API下载社交网络数据 157
7.3 创建邻接矩阵和连边列表 161
7.4 绘制社交网络数据 164
7.5 计算重要的网络度量指标 176
第8章 展现你最好的一面——制作文档和呈现分析报告 182
8.1 引言 182
8.2 用R Markdown和knitR创建数据分析报告 182
8.3 用shiny创建交互式Web应用 191
8.4 用R Presentation为分析报告创建PDF幻灯片 196
第9章 事半功倍——高效且简洁的R代码 201
9.1 引言 201
9.2 利用向量化操作 201
9.3 用apply函数操作整行或整列 203
9.4 用lapply和sapply将函数应用于整组元素 206
9.5 在向量的一个子集上应用函数 208
9.6 用plyr完成分割-应用-组合策略 210
9.7 用数据表对数据进行切片、切块和组合 213
第10章 在哪儿——地理空间信息数据分析 219
10.1 引言 219
10.2 下载并绘制一个地区的谷歌地图 219
10.3 在已下载的谷歌地图上叠加数据 222
10.4 将ESRI形状文件导入到R中 224
10.5 使用sp包绘制地理数据 226
10.6 从maps包中获取地图 228
10.7 从包含空间及其他数据的普通数据框中创建空间数据框 229
10.8 通过合并普通数据框和空间对象生成空间数据框 230
10.9 为已有的空间数据框添加变量 234
第11章 友好协作——连接到其他系统 237
11.1 引言 237
11.2 在R中使用Java对象 237
11.3 从Java中用JRI调用R函数 243
11.4 从Java中用Rserve调用R函数 245
11.5 从Java中执行R脚本 248
11.6 使用xlsx包连接到Excel 249
11.7 从关系型数据库—— MySQL中读取数据 252
11.8 从非关系型数据库——MongoDB中读取数据 256
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《近代世界史文献丛编 19》王强主编 2017
- 《Prometheus技术秘笈》百里燊 2019
- 《分析化学》陈怀侠主编 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《近代世界史文献丛编 36》王强主编 2017
- 《近代世界史文献丛编 11》王强主编 2017
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《近代世界史文献丛编 18》王强主编 2017
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《看漫画学钢琴 技巧 3》高宁译;(日)川崎美雪 2019
- 《优势谈判 15周年经典版》(美)罗杰·道森 2018
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《海明威书信集:1917-1961 下》(美)海明威(Ernest Hemingway)著;潘小松译 2019
- 《迁徙 默温自选诗集 上》(美)W.S.默温著;伽禾译 2020
- 《上帝的孤独者 下 托马斯·沃尔夫短篇小说集》(美)托马斯·沃尔夫著;刘积源译 2017
- 《巴黎永远没个完》(美)海明威著 2017
- 《剑桥国际英语写作教程 段落写作》(美)吉尔·辛格尔顿(Jill Shingleton)编著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019