第1章 关联规则 1
1.1 Apriori算法 2
1.1.1 算法概要 2
1.1.2 算法原理 2
1.1.3 实例说明 4
1.1.4 算法优缺点 10
1.1.5 优化改进 10
1.1.6 大数据适应度分析 12
1.1.7 地球科学应用案例 13
1.2 FP-growth算法 15
1.2.1 算法概要 15
1.2.2 算法原理 15
1.2.3 实例说明 17
1.2.4 优化改进 19
1.2.5 大数据适应度分析 21
1.2.6 地球科学应用案例 24
参考文献 26
第2章 分类 27
2.1 决策树算法 28
2.1.1 算法概要 28
2.1.2 算法原理 28
2.1.3 算法优缺点 31
2.1.4 优化改进 32
2.1.5 决策树衍生算法 33
2.1.6 大数据适应度分析 35
2.1.7 地球科学应用案例 37
2.2 贝叶斯分类算法 38
2.2.1 算法概要 38
2.2.2 算法原理 38
2.2.3 实例说明 40
2.2.4 算法优缺点 42
2.2.5 优化改进 42
2.2.6 大数据适应度分析 45
2.2.7 地球科学应用案例 46
2.3 神经网络分类算法 47
2.3.1 算法概要 47
2.3.2 算法原理 47
2.3.3 算法优缺点 51
2.3.4 优化改进 52
2.3.5 大数据适应度分析 53
2.3.6 地球科学应用案例 53
2.4 粗糙集分类 55
2.4.1 算法概要 55
2.4.2 算法原理 55
2.4.3 实例说明 62
2.4.4 算法优缺点 64
2.4.5 优化改进 64
2.4.6 大数据适应度分析 65
2.4.7 地球科学应用案例 66
2.5 支持向量机 66
2.5.1 算法概要 66
2.5.2 算法原理 67
2.5.3 实例说明 73
2.5.4 算法优缺点 74
2.5.5 优化改进 74
2.5.6 大数据适应度分析 76
2.5.7 地球科学应用案例 77
2.6 K-最近邻算法 78
2.6.1 算法概要 78
2.6.2 算法原理 78
2.6.3 算法优缺点 80
2.6.4 优化改进 80
2.6.5 大数据适应度分析 82
2.6.6 地球科学应用案例 85
2.7 Bagging算法 86
2.7.1 算法概要 86
2.7.2 算法原理 87
2.7.3 实例说明 90
2.7.4 优化改进 93
2.7.5 大数据适应度分析 94
2.7.6 地球科学应用案例 95
2.8 AdaBoost算法 96
2.8.1 算法概要 96
2.8.2 算法原理 97
2.8.3 训练过程 99
2.8.4 同类算法 100
2.8.5 大数据适应度分析 103
2.8.6 地球科学应用案例 103
参考文献 105
第3章 回归 115
3.1 线性回归 116
3.1.1 算法概要 116
3.1.2 算法原理 116
3.1.3 实例说明 119
3.1.4 算法优缺点 120
3.1.5 优化改进 121
3.1.6 大数据适应度分析 123
3.1.7 地球科学应用案例 123
3.2 逻辑回归 124
3.2.1 算法概要 124
3.2.2 算法原理 125
3.2.3 算法实现 127
3.2.4 SoftMax算法 129
3.2.5 大数据适应度分析 129
3.2.6 地球科学应用案例 130
参考文献 131
第4章 聚类 133
4.1 K-means算法 134
4.1.1 算法概要 134
4.1.2 算法原理 134
4.1.3 实例说明 135
4.1.4 算法优缺点 138
4.1.5 优化改进 138
4.1.6 大数据适应度分析 140
4.1.7 地球科学应用案例 141
4.2 K-medoids算法 142
4.2.1 算法概要 142
4.2.2 算法原理 142
4.2.3 实例说明 144
4.2.4 算法优缺点 147
4.2.5 优化改进 148
4.2.6 大数据适应度分析 149
4.2.7 地球科学应用案例 149
4.3 层次聚类算法 151
4.3.1 算法概要 151
4.3.2 距离度量 151
4.3.3 算法流程 153
4.3.4 改进优化 154
4.3.5 大数据适应度分析 158
4.3.6 地球科学应用案例 159
4.4 基于密度的聚类算法 160
4.4.1 算法概要 160
4.4.2 算法原理 160
4.4.3 实例说明 162
4.4.4 算法优缺点 164
4.4.5 优化改进 165
4.4.6 大数据适应度分析 166
4.4.7 地球科学应用案例 167
4.5 基于网格的聚类算法 168
4.5.1 算法概要 168
4.5.2 STING 168
4.5.3 CLIQUE 170
45.4 优化改进 173
4.5.5 大数据适应度分析 176
4.5.6 地球科学应用案例 177
参考文献 179
第5章 序列模式挖掘 183
5.1 GSP算法 184
5.1.1 算法概要 184
5.1.2 算法原理 184
5.1.3 实例说明 189
5.1.4 算法优缺点 191
5.1.5 GSP衍生算法 192
5.1.6 大数据适应度分析 194
5.1.7 地球科学应用案例 195
5.2 SPADE算法 196
5.2.1 算法概要 196
5.2.2 算法原理 197
5.2.3 实例说明 203
5.2.4 算法优缺点 206
5.2.5 优化改进 206
5.2.6 SPADE衍生算法 207
5.2.7 大数据适应度分析 209
5.2.8 地球科学应用案例 213
参考文献 215
第6章 深度学习 217
6.1 深度信念网 218
6.1.1 算法概要 218
6.1.2 算法原理 219
6.1.3 优化改进 225
6.1.4 大数据适应度分析 226
6.1.5 地球科学应用案例 227
6.2 卷积神经网络 228
6.2.1 算法概要 228
6.2.2 算法原理 228
6.2.3 实例说明 229
6.2.4 模型演化 231
6.2.5 优化改进 234
6.2.6 大数据适应度分析 235
6.2.7 地球科学应用案例 235
6.3 自动编码器算法 237
6.3.1 算法概要 237
6.3.2 算法原理 238
6.3.3 算法实现 240
6.3.4 衍生算法 241
6.3.5 优化改进 243
6.3.6 大数据适应度分析 244
6.3.7 地球科学应用案例 245
参考文献 245
第7章 异常检测 249
7.1 概述 250
7.2 基于统计的异常检测算法 251
7.2.1 算法原理 251
7.2.2 典型算法 251
7.3 基于距离的方法 252
7.3.1 算法原理 252
7.3.2 典型算法 252
7.4 基于深度的异常检测方法 256
7.4.1 算法原理 256
7.4.2 典型算法 257
7.5 基于密度的异常检测算法 258
7.5.1 算法原理 258
7.5.2 典型算法 258
7.6 基于偏离的异常检测算法 262
7.6.1 算法原理 262
7.6.2 典型算法 263
7.7 基于聚类的异常检测算法 265
7.7.1 算法原理 265
7.7.2 典型算法 265
7.8 大数据适应度分析 268
7.9 地球科学应用案例 269
参考文献 271
附录A软件、源码及开发包 275