《金融数据挖掘》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:刘振亚,李伟编著
  • 出 版 社:北京:中国经济出版社
  • 出版年份:2016
  • ISBN:9787513642484
  • 页数:218 页
图书介绍:本书的案例均采用股票市场数据来进行数据挖掘分析,利用最为简明实用的一些数据挖掘方法来诠释金融数据挖掘的魅力,以期每一名本书的读者都够掌握一些本书介绍的方法,并应用于股票市场投资当中去。当然,正像所有投资书籍及投资机构都会提到的一样,本书也必须指出,“投资有风险,挖掘需谨慎”。

导言 1

第一章 有监督的金融数据分类分析——Logit、LDA、QDA与KNN 4

第一节 Logistic分类法 4

第二节 LDA、QDA与KNN分类法 10

一、LDA分类法 10

二、QDA分类法 15

三、KNN分类法 16

四、小结 16

第三节 案例1:上证综合指数涨跌预测 17

第二章 无监督的金融数据分类分析——聚类分析 36

第一节 系统聚类法和K-means聚类法 36

一、系统聚类法 36

二、K-means聚类法 37

第二节 案例2:系统聚类分析法的应用——股指状态阶段的判断与划分 38

第三节 案例3:应用K-means聚类法分析月度股指数据 46

第三章 金融数据重抽样 53

第一节 交叉验证方法 53

一、基础交叉验证法 53

二、改进方法 54

三、分类问题中的交叉验证法 56

第二节 拔靴法 57

第三节 案例4:重抽样方法下的股指涨跌预测模型的再分析 59

第四章 线性模型筛选 69

第一节 子集筛选法 69

一、最优子集筛选 70

二、逐步选择 70

三、选择最优模型的标准 71

第二节 收缩筛选法 74

一、岭回归 74

二、Lasso方法 75

第三节 案例5:regsubsets函数在股指涨跌预测模型筛选中的用法 76

一、最优子集筛选法 76

二、向前筛选法 84

三、向后筛选法 88

第五章 克服维数灾难 97

第一节 主成分分析法 97

一、主成分分析法的原理 97

二、主成分得分法与主成分回归法 100

第二节 部分最小二乘法 104

一、提取方向 104

二、部分回归 104

三、主成分回归法和部分最小二乘法的优缺点 105

四、高维度问题小结 105

第三节 案例6:主成分分析法在选股中的应用 106

结果分析 109

第六章 决策树 113

第一节 决策树的分类和基本知识 113

一、回归树 113

二、分类树 119

三、树与线性模型的对比 122

四、树状模型的优缺点 123

第二节 三种提高树状模型预测精度的方法 124

一、Bagging 124

二、Random Forest 127

三、Boosting 130

第三节 案例7:决策树方法在股指涨跌预测中的应用 131

第四节 案例8:Bagging、Random Forest和Boosting方法在决策树模型中的应用 148

第七章 支持向量机 162

第一节 最大边际分类器与支持向量分类器 162

一、最大边际分类器 162

二、支持向量分类器 166

第二节 支持向量机 168

一、非线性决定边界的分类法 168

二、支持向量机 169

三、SVM与岭回归、Lasso和逻辑回归的关系 170

第三节 案例9:基于SVM方法的上证指数涨跌预测 172

一、判断样本点的可分性 172

二、SVM在实际数据中的应用的效果 181

三、结论 190

第八章 R语言及制图 198

第一节 基本操作 198

一、向量和矩阵输入 198

二、数据变换和生成随机数 199

三、数据索引(寻址) 200

四、载入数据 200

五、其他常用函数 201

第二节 R环境下的线性回归 202

一、一元线性回归 202

二、多元回归 202

三、构造函数 203

第三节 分类法 203

一、logistic回归 203

二、LDA模型 204

三、QDA模型 204

四、K最近邻法 204

第四节 重采样方法 205

一、布尔值 205

二、除一交叉验证法 205

三、k组交叉验证法 206

四、Bootstrap 206

第五节 模型的选择和调整 207

一、最优子集选择 207

二、岭回归和Lasso 208

第六节 R制图 209

一、绘图区域的布局 209

二、字体和颜色 210

三、数据点符号和线形 212

四、坐标轴、图例和标题 212

五、图形函数 213