大数据分析 R基础及应用PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:深圳国泰安教育技术股份有限公司,中科院深圳先进技术研究院-国泰安金融大数据研究中心编著
- 出 版 社:北京:清华大学出版社
- 出版年份:2016
- ISBN:9787302428633
- 页数:187 页
第一部分 大数据简介 3
第1章 大数据概述 3
1.1 大数据的概念 3
1.2 大数据的特征 4
1.3 大数据的产生 4
1.4 大数据应用案例 4
第2章 大数据相关技术 6
2.1 数据采集和准备 6
2.2 分布式数据库 7
2.3 分布式数据分析框架 9
2.3.1 Hadoop 9
2.3.2 HDFS 10
2.3.3 HBase 11
2.3.4 Hive 11
2.3.5 MapReduce 11
2.3.6 Strom 12
2.4 大数据分析与R 13
2.4.1 RHadoop 13
2.4.2 RHIPE 15
2.4.3 RHive 15
2.4.4 RHBase 16
2.5 国泰安的大数据 16
2.5.1 大数据实验室建设 16
2.5.2 大数据分析平台 19
第二部分 R 语言 23
第3章 R语言简介 23
3.1 R语言概述 23
3.2 R的下载、安装和使用 24
3.2.1 RGui界面 24
3.2.2 RStudio界面 27
3.2.3 R的运行 29
3.2.4 工作目录和工作空间 30
3.2.5 R语言的帮助 32
3.3 R的包 33
3.3.1 包的获取 33
3.3.2 包的安装 36
3.3.3 包的加载 40
3.3.4 包的使用 41
第4章 R语言基本操作 42
4.1 数据结构 42
4.2 数据的基本操作 43
4.2.1 赋值和创建 43
4.2.2 数据的运算 49
4.2.3 数据的导入 50
4.3 数据的管理 52
4.3.1 数据排序 52
4.3.2 数据集的合并 53
4.3.3 剔除变量 54
4.3.4 数据集提取 54
4.3.5 subset函数 55
4.4 常用函数 56
第5章 R语言绘图 57
5.1 绘图参数 57
5.1.1 符号、线条与颜色 59
5.1.2 标题、坐标轴与图例 61
5.1.3 文本属性 63
5.1.4 图形的组合 65
5.2 高级绘图函数 66
5.2.1 通用二维图 67
5.2.2 饼图 67
5.2.3 箱线图 68
5.2.4 条形图 71
5.2.5 直方图 72
5.2.6 核密度图 74
5.2.7 点图 76
5.3 低级绘图函数 77
第6章 R语言数据分析 79
6.1 数据处理基础函数 79
6.1.1 数学函数 79
6.1.2 统计函数 80
6.1.3 概率函数 81
6.1.4 数据分析实例 81
6.2 描述性统计分析 84
6.2.1 描述统计函数 84
6.2.2 软件包的描述统计 86
6.3 多元统计分析 88
6.3.1 方差分析 89
6.3.2 判别分析 91
6.3.3 聚类分析 92
6.3.4 主成分分析 94
6.3.5 因子分析 97
6.3.6 典型相关分析 101
第三部分 专题实证研究 107
第7章 金融时间序列建模专题 107
7.1 金融时间序列 107
7.2 ARMA模型 110
7.2.1 ARMA模型简介 110
7.2.2 ARMA模型定阶 110
7.2.3 ARMA模型拟合 111
7.3 GARCH模型 112
7.3.1 GARCH模型简介 112
7.3.2 GARCH模型拟合 112
第8章 动态面板数据专题 114
8.1 GMM估计 114
8.1.1 系统GMM估计 114
8.1.2 GMM估计原理 115
8.2 动态面板数据模型的系统GMM估计 115
第9章 数据挖掘专题 121
9.1 关联规则 121
9.2 降维分析 122
9.3 社交网络分析 125
9.4 贝叶斯分类法 128
9.4.1 贝叶斯定理 128
9.4.2 贝叶斯分类实例 128
9.5 决策树 130
9.5.1 决策树原理 130
9.5.2 决策树分类实例 131
9.6 人工神经网络 133
9.6.1 三层前馈神经网络原理 133
9.6.2 神经网络分类实例 134
9.7 支持向量机 136
9.7.1 支持向量机原理 136
9.7.2 支持向量机分类实例 137
第10章 信息可视化专题 140
10.1 绘制地图 140
10.1.1 世界地图 141
10.1.2 中国地图 141
10.1.3 公路线图 142
10.2 可视化实例 144
10.2.1 数据 144
10.2.2 ggmap 145
第四部分 RHadoop案例分析 153
第11章 RHadoop的基本操作 153
11.1 数据文件的读取 153
11.2 包的加载 154
11.3 基本函数 155
第12章 RHadoop 环境下案例分析 157
12.1 回归分析 157
12.1.1 回归分析原理 157
12.1.2 线性回归分析案例 158
12.2 Logistic分析 161
12.2.1 Logistic分析原理 161
12.2.2 Logistic分析案例 162
12.3 判别分析 163
12.3.1 线性判别分析原理 163
12.3.2 线性判别分析案例 164
12.4 聚类分析 167
12.4.1 K-means聚类分析原理 167
12.4.2 K-means聚类分析案例 168
12.5 主成分分析 170
12.5.1 主成分分析原理 170
12.5.2 主成分分析案例 171
12.6 因子分析 173
12.6.1 因子分析原理 173
12.6.2 因子分析案例 174
12.7 商品推荐算法 176
12.7.1 商品推荐算法原理 176
12.7.2 商品推荐案例 177
12.8 差异分析 179
12.8.1 多维标度法的原理 179
12.8.2 差异分析案例 180
附录一 国泰安CSMAR数据下载 182
附录二 深圳国泰安教育技术股份有限公司简介 184
参考文献 186
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《红色旅游的社会效应研究》吴春焕著 2019
- 《汉语词汇知识与习得研究》邢红兵主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《生物质甘油共气化制氢基础研究》赵丽霞 2019
- 《东北民歌文化研究及艺术探析》(中国)杨清波 2019
- 《联吡啶基钌光敏染料的结构与性能的理论研究》李明霞 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《培生高级英语语法 练习册》培生教育 2019
- 《办好人民满意的教育 全国教育满意度调查报告》(中国)中国教育科学研究院 2019
- 《2012年湖州蓝皮书》俞立安主编 2012
- 《绿色过程工程与清洁生产技术 张懿院士论文集精选 上》《绿色过程工程与清洁生产技术》编写组编 2019
- 《AutoCAD 2018自学视频教程 标准版 中文版》CAD/CAM/CAE技术联盟 2019
- 《小牛顿科学故事馆 进化论的故事》小牛顿科学教育公司编辑团队 2018
- 《看不见的室内空气污染》侯立安主编 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019