导言 1
第一章 有监督的金融数据分类分析——Logit、LDA、QDA与KNN 4
第一节 Logistic分类法 4
第二节 LDA、QDA与KNN分类法 10
一、LDA分类法 10
二、QDA分类法 15
三、KNN分类法 16
四、小结 16
第三节 案例1:上证综合指数涨跌预测 17
第二章 无监督的金融数据分类分析——聚类分析 36
第一节 系统聚类法和K-means聚类法 36
一、系统聚类法 36
二、K-means聚类法 37
第二节 案例2:系统聚类分析法的应用——股指状态阶段的判断与划分 38
第三节 案例3:应用K-means聚类法分析月度股指数据 46
第三章 金融数据重抽样 53
第一节 交叉验证方法 53
一、基础交叉验证法 53
二、改进方法 54
三、分类问题中的交叉验证法 56
第二节 拔靴法 57
第三节 案例4:重抽样方法下的股指涨跌预测模型的再分析 59
第四章 线性模型筛选 69
第一节 子集筛选法 69
一、最优子集筛选 70
二、逐步选择 70
三、选择最优模型的标准 71
第二节 收缩筛选法 74
一、岭回归 74
二、Lasso方法 75
第三节 案例5:regsubsets函数在股指涨跌预测模型筛选中的用法 76
一、最优子集筛选法 76
二、向前筛选法 84
三、向后筛选法 88
第五章 克服维数灾难 97
第一节 主成分分析法 97
一、主成分分析法的原理 97
二、主成分得分法与主成分回归法 100
第二节 部分最小二乘法 104
一、提取方向 104
二、部分回归 104
三、主成分回归法和部分最小二乘法的优缺点 105
四、高维度问题小结 105
第三节 案例6:主成分分析法在选股中的应用 106
结果分析 109
第六章 决策树 113
第一节 决策树的分类和基本知识 113
一、回归树 113
二、分类树 119
三、树与线性模型的对比 122
四、树状模型的优缺点 123
第二节 三种提高树状模型预测精度的方法 124
一、Bagging 124
二、Random Forest 127
三、Boosting 130
第三节 案例7:决策树方法在股指涨跌预测中的应用 131
第四节 案例8:Bagging、Random Forest和Boosting方法在决策树模型中的应用 148
第七章 支持向量机 162
第一节 最大边际分类器与支持向量分类器 162
一、最大边际分类器 162
二、支持向量分类器 166
第二节 支持向量机 168
一、非线性决定边界的分类法 168
二、支持向量机 169
三、SVM与岭回归、Lasso和逻辑回归的关系 170
第三节 案例9:基于SVM方法的上证指数涨跌预测 172
一、判断样本点的可分性 172
二、SVM在实际数据中的应用的效果 181
三、结论 190
第八章 R语言及制图 198
第一节 基本操作 198
一、向量和矩阵输入 198
二、数据变换和生成随机数 199
三、数据索引(寻址) 200
四、载入数据 200
五、其他常用函数 201
第二节 R环境下的线性回归 202
一、一元线性回归 202
二、多元回归 202
三、构造函数 203
第三节 分类法 203
一、logistic回归 203
二、LDA模型 204
三、QDA模型 204
四、K最近邻法 204
第四节 重采样方法 205
一、布尔值 205
二、除一交叉验证法 205
三、k组交叉验证法 206
四、Bootstrap 206
第五节 模型的选择和调整 207
一、最优子集选择 207
二、岭回归和Lasso 208
第六节 R制图 209
一、绘图区域的布局 209
二、字体和颜色 210
三、数据点符号和线形 212
四、坐标轴、图例和标题 212
五、图形函数 213