当前位置:首页 > 经济
大数据  财务分析R与Hadoop实训
大数据  财务分析R与Hadoop实训

大数据 财务分析R与Hadoop实训PDF电子书下载

经济

  • 电子书积分:10 积分如何计算积分?
  • 作 者:李晓龙主编
  • 出 版 社:北京:经济管理出版社
  • 出版年份:2018
  • ISBN:9787509642252
  • 页数:250 页
图书介绍:本教材是财务报表分析与金融计量实训方面的高级实训教材教材。本教材集中论述了大数据时代特征,尤其是大数据时代下的财务报表分析、金融计量模型和R语言实训模型。本教材的核心成果是大数据时代下的财务报表分析和基于R语言的金融计量实训,尤其是包含相应的代码和数据集。该教材适合于准备从事金融风险管理、财务管理、证券投资、投资银行、风险投资、产业投资、或公司财务工作的同学修读。通过对该课程的学习,同学可以对大数据时代下的财务分析有一定了解,更重要的是可以掌握R语言工具进行财务建模和分析,并在此基础上撰写一定的研究报告和科研论文,为未来进一步学习深造或工作奠定坚持的理论和实践基础。
《大数据 财务分析R与Hadoop实训》目录

第一部分 大数据与财务分析 3

第1章 大数据基础概念 3

1.1 大数据基础概念 3

1.2 大数据缘起特征 4

1.2.1 数据产生由企业内部向企业外部扩展 4

1.2.2 数据产生由Web1.0向Web2.0、由互联网向移动互联网扩展 5

1.2.3 数据产生由计算机/互联网(IT)向物联网(IOT)扩展 5

1.3 大数据应用案例 6

1.3.1 余额宝的业务背景 6

1.3.2 余额宝的系统建设 7

1.4 大数据人才培养 9

第2章 财经数据分析基础 11

2.1 会计基础概念 11

2.1.1 会计基本职能 12

2.1.2 会计基本目标 12

2.1.3 会计核心要素 12

2.1.4 会计记账方法 15

2.1.5 会计核算原则 15

2.2 资产负债表 16

2.2.1 资产负债表概述 16

2.2.2 企业资产分析 17

2.2.3 企业负债分析 18

2.2.4 企业权益分析 18

2.2.5 资产负债分析其他事项 19

2.3 损益表 21

2.3.1 收入分析 21

2.3.2 支出分析 22

2.3.3 影响事项 22

2.3.4 市盈率分析 23

2.4 现金流量表 24

2.4.1 现金流量表内容 24

2.4.2 现金流量表计算 25

2.4.3 自由现金流 26

第3章 大数据基础技术 28

3.1 数据采集和清洗 28

3.2 数据库和数据存储 29

3.2.1 信息世界 30

3.2.2 数据世界 30

3.2.3 实体—联系方法(Entity-Relationship Approach) 30

3.2.4 数据模型 31

3.2.5 SQL的发展 31

3.3 数据挖掘和数据分析 35

3.3.1 聚类分析:如基于历史的MBR分析、遗传算法 36

3.3.2 关联分析:如购物篮分析 36

3.3.3 分类分析:如决策树、判别分析 36

3.4 大数据分析与R 37

第二部分 财务分析R与Hadoop语言 41

第4章 R语言简介 41

4.1 R语言概述 41

4.1.1 R语言的优势 41

4.1.2 其他常用统计软件 42

4.2 在Windows下获取和安装R软件 43

4.2.1 RGui界面 43

4.2.2 RStudio界面 46

4.2.3 R语言的帮助(Help) 47

4.3 在Linux上搭建R环境 49

4.3.1 搭建前的准备工作 49

4.3.2 下载与解压(以R -2.15.3为例) 49

4.3.3 编译 50

4.3.4 安装 50

4.4 R包(Packages) 51

4.4.1 如何寻找相关的Packages 51

4.4.2 安装Packages 54

4.4.3 调用Packages 59

4.5 工作目录和工作空间 61

4.5.1 获取和设定工作目录 61

4.5.2 工作空间的保存 62

4.5.3 系统设置 64

第5章 R语言基本操作 65

5.1 赋值和运算 65

5.1.1 赋值 65

5.1.2 简单运算 66

5.2 数据结构 67

5.2.1 向量的建立 68

5.2.2 矩阵的建立 71

5.2.3 数组的建立 73

5.2.4 数据框的建立 74

5.3 导入和导出数据 79

5.3.1 导入数据 79

5.3.2 导出数据 81

5.3.3 Excel数据的导入 81

5.3.4 导入导出数据时需要注意的问题 82

5.4 数据的管理 84

5.4.1 数据排序(order/sort) 84

5.4.2 数据集的合并(insert) 86

5.4.3 剔除变量(delete) 91

5.4.4 数据集提取(select) 92

5.4.5 subset()函数 94

5.4.6 缺失值的处理 94

5.5 常用函数 97

第6章 Hadoop简介 100

6.1 Hadoop 100

6.1.1 Hadoop概述 100

6.1.2 Hadoop的功能和特点 100

6.1.3 Hadoop的发展与现状 101

6.1.4 Hadoop的核心架构 102

6.2 Hadoop的数据管理 104

6.2.1 HDFS 104

6.2.2 HBase 107

6.2.3 Hive 110

6.3 ZooKeeper原理 113

6.3.1 ZooKeeper的基本概念 113

6.3.2 ZooKeeper在Hadoop及HBase中的具体作用 114

6.4 Hadoop大数据处理的意义 114

第三部分 财务分析实训 125

第7章 财经大数据探索性分析 125

7.1 探索性分析常用函数 126

7.1.1 数学函数 126

7.1.2 统计函数 127

7.1.3 分类分组函数 130

7.1.4 概率函数 133

7.1.5 日期函数 134

7.1.6 极端值处理 137

7.2 盈利能力分析 138

7.2.1 查询盈利能力数据 138

7.2.2 导入盈利能力数据 138

7.2.3 合并盈利能力数据 139

7.2.4 计算所有公司的盈利能力 140

7.2.5 计算万科的盈利能力 141

7.2.6 计算房地产的盈利能力 141

7.2.7 计算竞争对手的盈利能力 142

7.2.8 导出盈利能力roa数据 143

7.3 偿债能力分析 143

7.3.1 查询偿债能力数据 143

7.3.2 导入偿债能力数据 143

7.3.3 合并偿债能力数据 145

7.3.4 计算所有公司的偿债能力 145

7.3.5 计算万科的偿债能力 146

7.3.6 计算房地产的偿债能力 146

7.3.7 计算竞争对手的偿债能力 147

7.3.8 导出偿债能力Lev数据 148

7.4 经营能力分析 148

7.4.1 查询经营能力数据 148

7.4.2 导入经营能力数据 148

7.4.3 合并经营能力数据 149

7.4.4 计算所有公司的经营能力 150

7.4.5 万科经营能力分析 151

7.4.6 计算房地产的经营能力 151

7.4.7 导出经营能力yingshou数据 152

7.5 风险水平分析 152

7.5.1 查询风险水平数据 153

7.5.2 导入风险水平数据 153

7.5.3 合并风险水平数据 154

7.5.4 计算所有公司的风险水平 154

7.5.5 计算万科的风险水平 155

7.5.6 计算房地产的风险水平 156

7.5.7 导出风险水平DFL数据 157

第8章 财经大数据可视化分析 158

8.1 指标可视化概述 158

8.1.1 图形的最基础构成 158

8.1.2 绘图函数分类 159

8.2 绘图参数 161

8.2.1 高级绘图参数 161

8.2.2 低级绘图参数 165

8.2.3 点符号、线条与颜色 168

8.2.4 标题、坐标轴与图例 172

8.2.5 一幅图多个图表 175

8.3 高级绘图函数 178

8.3.1 通用二维图 178

8.3.2 饼图 179

8.3.3 箱线图 181

8.3.4 条形图 185

8.3.5 直方图 188

8.3.6 核密度图 190

8.4 低级绘图函数 193

8.5 ggplot2 195

8.5.1 ggplot2简介 195

8.5.2 几个基本概念 196

8.5.3 图层控制与直方图 197

8.5.4 位置调整与条形图 199

8.5.5 散点图 203

第9章 财经大数据相关回归分析 206

9.1 回归模型基本原理 206

9.2 普通最小二乘估计(OLS) 207

9.3 极大似然估计(MLE) 207

9.4 线性回归模型应用分析 207

9.4.1 查询下载指数数据 209

9.4.2 导入指数数据 209

9.4.3 合并数据 210

9.4.4 缺失值处理 210

9.4.5 探索性统计分析 211

9.4.6 导入更新的数据 213

9.4.7 数据的回归模型 217

第10章 财经大数据时间序列分析 220

10.1 金融时间序列及其特征 220

10.2 ARMA模型 223

10.2.1 ARMA模型简介 223

10.2.2 ARMA模型定阶 224

10.2.3 ARMA模型拟合 226

10.3 异方差时间序列模型 227

10.3.1 GARCH模型简介 227

10.3.2 GARCH模型拟合 228

10.4 多项式回归 232

10.5 分位数回归 236

10.5.1 分位数回归拟合 236

10.5.2 分位数回归与VaR 239

附录 242

附表1 2012年我国各地区科技发展状况 242

附表2 2015年1月4日至12月30日上证综合收盘价格指数 243

参考文献 247

后记 249

返回顶部