第1章 宏观经济数据挖掘基础知识 1
1.1 数据挖掘概述 1
1.1.1 数据挖掘的定义 1
1.1.2 数据挖掘的功能 1
1.1.3 数据挖掘的过程 3
1.1.4 数据挖掘的研究方向 5
1.2 宏观经济概述 6
1.2.1 宏观经济的定义及其研究内容 6
1.2.2 宏观经济的研究方法 6
1.2.3 主要宏观经济指标解读 8
1.3 数据挖掘方法在宏观经济中的应用 11
1.3.1 分类 12
1.3.2 聚类 12
1.3.3 预测 13
1.3.4 关联 13
1.3.5 异常点 14
本章参考文献 14
第2章 宏观经济数据预处理 17
2.1 原始数据中存在的问题 17
2.2 数据预处理的功能 19
2.2.1 数据清理 19
2.2.2 数据集成 20
2.2.3 数据变换 21
2.2.4 数据归约 22
2.3 常见的数据预处理技术 22
2.3.1 处理空缺值 23
2.3.2 数据去噪 24
2.3.3 数据规范化 26
2.3.4 数据规约 28
2.4 预测GDP数据预处理过程 33
2.4.1 数据选择 33
2.4.2 数据预处理换算 33
2.4.3 预测数据回算调整 34
2.4.4 预处理结果 34
本章参考文献 35
第3章 分类算法 36
3.1 分类算法概述 36
3.1.1 分类模型训练阶段 36
3.1.2 分类模型评估阶段 37
3.1.3 分类阶段 37
3.2 分类算法的应用 39
3.3 C4.5分类算法 43
3.3.1 C4.5原理与工具应用 43
3.3.2 C4.5分类算法在第三产业发展状况评估中的应用 46
3.4 支持向量机分类 50
3.4.1 支持向量机的原理 51
3.4.2 支持向量机软件应用 54
3.4.3 支持向量机分类在宏观经济预警中的应用 55
3.5 朴素贝叶斯分类 61
3.5.1 朴素贝叶斯原理概述 61
3.5.2 朴素贝叶斯方法在宏观经济决策中的应用 62
本章参考文献 69
第4章 聚类分析 71
4.1 聚类分析方法概述 71
4.1.1 聚类统计量 72
4.1.2 系统聚类方法 77
4.2 聚类方法的应用 82
4.3 Ward聚类分析方法 86
4.3.1 Ward算法原理 86
4.3.2 Ward算法应用 87
4.3.3 工业化城镇化问题聚类分析案例 93
4.4 聚类结果评估 109
本章参考文献 111
第5章 预测方法 112
5.1 宏观经济预测方法概述 112
5.1.1 ARMA与ARIMA算法介绍 112
5.1.2 ARCH算法 115
5.1.3 GMDH算法概述 117
5.1.4 AC算法介绍 118
5.1.5 组合预测算法 120
5.2 预测方法的应用 122
5.2.1 对GDP的预测 122
5.2.2 对工业增加值的预测 123
5.2.3 对股票市场的预测 123
5.2.4 对财务指标的预测 124
5.2.5 对其他方面的预测 125
5.3 常用软件预测方法 125
5.3.1 用Eviews建立ARIMA模型过程 125
5.3.2 用Eviews建立ARCH模型 131
5.3.3 GMDH模型软件使用方法 135
5.3.4 AC模型软件使用方法 139
5.3.5 构造组合模型 142
5.4 中国宏观经济指标预测案例 144
5.4.1 建立ARIMA模型预测GDP 145
5.4.2 建立ARCH模型预测GDP 146
5.4.3 建立GMDH模型预测GDP 146
5.4.4 建立AC模型预测GDP 147
5.4.5 线性组合模型预测 147
5.4.6 预测结果对比分析 148
本章参考文献 148
第6章 关联规则 151
6.1 关联规则概述 151
6.2 经典算法——Apriori算法原理 154
6.3 关联规则的应用 157
6.4 关联规则挖掘在宏观经济预警分析中的应用 160
6.4.1 数据准备 160
6.4.2 宏观经济预警关联规则挖掘过程 166
6.4.3 宏观经济预警关联规则挖掘结果分析 176
本章参考文献 177
第7章 DEA方法 178
7.1 DEA概述 178
7.2 DEA基本原理 179
7.2.1 C2R模型 179
7.2.2 C2R模型的经济含义 182
7.2.3 评价技术有效性的C2GS2模型 183
7.3 DEA的应用 184
7.4 DEA软件应用 186
7.5 产业效率分析案例 189
7.5.1 三次产业总体评价 192
7.5.2 分行业评价 194
本章参考文献 195
第8章 主成分分析 198
8.1 主成分分析概述 198
8.1.1 主成分分析的代数意义 199
8.1.2 主成分分析的几何意义 199
8.2 主成分分析的原理 200
8.2.1 主成分分析的目标 200
8.2.2 正交矩阵的求解算法 200
8.2.3 正交矩阵的标准化变量算法 201
8.2.4 主成分的确定 202
8.2.5 主成分分析的优缺点 203
8.3 主成分分析方法的应用 203
8.4 主成分分析软件的应用 206
8.5 产业结构转换研究案例 207
8.5.1 产业结构转换能力综合评价的指标体系的确定 207
8.5.2 四川省产业结构转换能力的综合评价 208
8.5.3 运用GMDH分析产业比重分布对产业结构转换能力的影响 214
8.5.4 分析四川省产业结构转换方向 214
本章参考文献 216