第1章 最简单的统计分析原理 1
1.1 统计分析原理 2
1.1.1 估计原理 3
1.1.2 检验原理 4
1.2 函数原理和数据分析 5
1.3 再进一步 6
第2章 R的基本环境与安装 8
2.1 R与网络资源 8
2.2 安装系统程序 10
2.3 更改语言模式 14
第3章 R的IDE模式 18
3.1 R Commander 18
3.2 Deducer 21
3.3 RStudio 23
3.3.1 安装 23
3.3.2 更改界面 26
3.3.3 产生文件 27
3.3.4 Mark Down 28
第4章 数据结构和数据处理 31
4.1 R的数据结构 31
4.1.1 vectors向量 32
4.1.2 matrix矩阵 35
4.1.3 array数组 37
4.1.4 data frame数据框 38
4.1.5 time series时间序列 40
4.1.6 list列表 41
4.2 数据处理 43
4.2.1 向量处理 43
4.2.2 矩阵处理 48
4.2.3 数据框data.frame对象的数据处理 50
4.2.4 字符串对象的处理 53
4.2.5 从连续性质的数据定义分组因子 55
第5章 数据存取和基本处理 57
5.1 外部数据读取 57
5.1.1 载入.csv格式的数据 58
5.1.2 载入.txt格式的数据 59
5.1.3 载入xls和xlsx格式的数据 60
5.1.4 将数据存储与输出 62
5.2 数据的基本统计分析library(fBasics) 64
5.2.1 基本统计量:basicStats() 64
5.2.2 相关性检验:correlationTest() 65
5.3 网络数据下载 68
5.4 数据库读取——MySQL范例 73
5.5 数据表处理的函数 76
5.5.1 函数split对数据的分割 76
5.5.2 函数apply()系列 77
第6章 探索性数据分析和可视化 81
6.1 数据性质的可视化分析 83
6.2 绘图函数plot() 85
6.3 3D立体绘图 91
6.4 Imaging Correlation相关性影像图 94
6.5 lattice和Multi-way 98
6.6 其他 113
6.6.1 curve()函数曲线绘图 113
6.6.2 保存图形 114
第7章 回归分析方法 116
7.1 线性回归的基本原理——最小二乘法 116
7.2 单变量线性回归 117
7.3 连续变量线性复回归 125
7.3.1 两个解释变量相异 125
7.3.2 多项式回归——解释变量的幂次方 125
7.4 因子和交互效果 126
7.4.1 因子回归 126
7.4.2 交互效果 127
7.4.3 考虑残差异质性的鲁棒协方差 129
7.5 回归诊断检验 130
7.5.1 异质残差检验 130
7.5.2 回归函数形式判定 131
7.6 简单时间序列回归:dynlm() 133
7.7 线性重合检验 135
第8章 时间序列入门 137
8.1 时间序列性质 137
8.2 时间序列数据的建立与绘图 138
8.2.1 时间序列的时间格式 138
8.2.2 时间序列绘图 139
8.3 单组时间序列的性质 143
8.3.1 ACF、PACF和序列相关检验 143
8.3.2 Linear filters,时间序列性质线性过滤和趋势预测 144
8.3.3 BDS independence test时间序列独立同分布检验 149
8.3.4 方差比检验 151
8.4 ARMA(自回归移动平均)过程 153
8.4.1 一般ARMA模式 153
8.4.2 季节ARMA 154
8.5 序列相关与检验 156
8.5.1 原理 156
8.5.2 回归修正:对原回归残差做二阶序列相关修正 157
8.6 时间序列预测 158
8.6.1 基本概念 158
8.6.2 预测表现评估 158
8.7 ARIMA和Seasonal ARIMA的自动配置 161
8.8 VAR多变量 162
8.8.1 原理 162
8.8.2 R程序包与程序范例 163
第9章 波动分析 170
9.1 单变量GARCH原理 170
9.1.1 标准GARCH 171
9.1.2 非对称GARCH 172
9.2 简单单变量GARCH程序包tseries 173
9.2.1 数据的ARCH效果检验 173
9.2.2 标准GARCH估计 174
9.2.3 标准GARCH估计程序包fGarch 176
9.3 专业GARCH程序包rugarch 181
9.3.1 rugarch的基本结构 181
9.3.2 rugarch的高级设置 188
9.3.3 iClick程序包的统一处理 189
9.4 多变量GARCH程序包rmgarch 190
9.4.1 多变量GARCH原理 190
9.4.2 R程序包rmgarch 192
第10章 非定态时间序列 201
10.1 单位根检验 201
10.2 协整分析 209
10.2.1 ECM的基本形态(Engle和Granger在1987年提出) 209
10.2.2 Threshold VECM(阈值VECM) 215
10.3 具有阈值的单位根过程 217
第11章 时间序列的结构变动 224
11.1 基本原理的认识 224
11.1.1 efp方法 224
11.1.2 F检验法 231
11.2 Bai-Perron和Zeileis et al.的方法 233
11.2.1 原理 233
11.2.2 R范例程序解说 235
第12章 价差与计量套利 242
12.1 价差原理 242
12.1.1 典型价差交易:期货vs.现货 242
12.1.2 时间价差(Calendar/Terms spread):远月vs.近月 242
12.1.3 规律的价格差距 243
12.1.4 商品间的趋势价差 243
12.2 风险溢价的高级应用 244
12.2.1 风险溢价的进一步认识 244
12.2.2 价差与套利的计量经济学 245
第13章 R的金融工具箱 253
13.1 时间序列对象的三大程序包 253
13.1.1 基本数据处理 253
13.1.2 程序包timeSeries的财务函数 254
13.2 fBasics程序包的财务时间序列性质摘要 255
13.3 fAssets程序包的风险与报酬 256
13.4 PerformanceAnalytics程序包的绩效指标 256
13.5 quantmod程序包的技术分析 257
13.6 程序编写的简单技巧 259
13.6.1 循环 259
13.6.2 条件控制语句 260
13.6.3 定义函数 261
第14章 风险与投资组合分析 265
14.1 资产选择初步 265
14.1.1 夏普不等式原理 265
14.1.2 R Code 265
14.2 多元化投资组合与回测 267
14.2.1 原理 267
14.2.2 R Code 269
第15章 金融大数据的处理 278
15.1 bigmemory 278
15.2 FF 281
15.3 bigmemory测试范例 283
15.4 高频率时间序列的时间格式 286
15.4.1 格式 286
15.4.2 程序包data.table 288
附录A 广义线性模式GLM 290
A.1 二元变量的Probit/Logit GLM 293
A.1.1 估计 293
A.1.2 拟合检验 295
A.1.3 优势比 296
A.1.4 超扩散和参数方差修正 296
A.2 有序选择变量的Probit/Logit GLM 297
A.3 计数型变量的Poisson GLM 300
A.4 多元选择GLM——Multinomial Probit/Logit 301