《国之重器出版工程 地球科学中的大数据分析与挖掘算法手册》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:李国庆,刘莹,庞禄申等编著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2018
  • ISBN:9787115478559
  • 页数:290 页
图书介绍:本书选择了30多种在地球科学大数据挖掘分析中较长用到或者具有应用潜力的算法,从算法介绍、数学原理、算法发展历史、算法实现、开源代码、大数据应用案例等方面进行系统完整的阐述、推理和论证,重点集中在这些算法在地球科学大数据中的应用经验,用于地球科学中的大数据实践,能够进行数据分析、信息挖掘以及知识发现,指导更多的读者能够完整地形成大数据思维模式,并掌握数据分析与挖掘技术。

第1章 关联规则 1

1.1 Apriori算法 2

1.1.1 算法概要 2

1.1.2 算法原理 2

1.1.3 实例说明 4

1.1.4 算法优缺点 10

1.1.5 优化改进 10

1.1.6 大数据适应度分析 12

1.1.7 地球科学应用案例 13

1.2 FP-growth算法 15

1.2.1 算法概要 15

1.2.2 算法原理 15

1.2.3 实例说明 17

1.2.4 优化改进 19

1.2.5 大数据适应度分析 21

1.2.6 地球科学应用案例 24

参考文献 26

第2章 分类 27

2.1 决策树算法 28

2.1.1 算法概要 28

2.1.2 算法原理 28

2.1.3 算法优缺点 31

2.1.4 优化改进 32

2.1.5 决策树衍生算法 33

2.1.6 大数据适应度分析 35

2.1.7 地球科学应用案例 37

2.2 贝叶斯分类算法 38

2.2.1 算法概要 38

2.2.2 算法原理 38

2.2.3 实例说明 40

2.2.4 算法优缺点 42

2.2.5 优化改进 42

2.2.6 大数据适应度分析 45

2.2.7 地球科学应用案例 46

2.3 神经网络分类算法 47

2.3.1 算法概要 47

2.3.2 算法原理 47

2.3.3 算法优缺点 51

2.3.4 优化改进 52

2.3.5 大数据适应度分析 53

2.3.6 地球科学应用案例 53

2.4 粗糙集分类 55

2.4.1 算法概要 55

2.4.2 算法原理 55

2.4.3 实例说明 62

2.4.4 算法优缺点 64

2.4.5 优化改进 64

2.4.6 大数据适应度分析 65

2.4.7 地球科学应用案例 66

2.5 支持向量机 66

2.5.1 算法概要 66

2.5.2 算法原理 67

2.5.3 实例说明 73

2.5.4 算法优缺点 74

2.5.5 优化改进 74

2.5.6 大数据适应度分析 76

2.5.7 地球科学应用案例 77

2.6 K-最近邻算法 78

2.6.1 算法概要 78

2.6.2 算法原理 78

2.6.3 算法优缺点 80

2.6.4 优化改进 80

2.6.5 大数据适应度分析 82

2.6.6 地球科学应用案例 85

2.7 Bagging算法 86

2.7.1 算法概要 86

2.7.2 算法原理 87

2.7.3 实例说明 90

2.7.4 优化改进 93

2.7.5 大数据适应度分析 94

2.7.6 地球科学应用案例 95

2.8 AdaBoost算法 96

2.8.1 算法概要 96

2.8.2 算法原理 97

2.8.3 训练过程 99

2.8.4 同类算法 100

2.8.5 大数据适应度分析 103

2.8.6 地球科学应用案例 103

参考文献 105

第3章 回归 115

3.1 线性回归 116

3.1.1 算法概要 116

3.1.2 算法原理 116

3.1.3 实例说明 119

3.1.4 算法优缺点 120

3.1.5 优化改进 121

3.1.6 大数据适应度分析 123

3.1.7 地球科学应用案例 123

3.2 逻辑回归 124

3.2.1 算法概要 124

3.2.2 算法原理 125

3.2.3 算法实现 127

3.2.4 SoftMax算法 129

3.2.5 大数据适应度分析 129

3.2.6 地球科学应用案例 130

参考文献 131

第4章 聚类 133

4.1 K-means算法 134

4.1.1 算法概要 134

4.1.2 算法原理 134

4.1.3 实例说明 135

4.1.4 算法优缺点 138

4.1.5 优化改进 138

4.1.6 大数据适应度分析 140

4.1.7 地球科学应用案例 141

4.2 K-medoids算法 142

4.2.1 算法概要 142

4.2.2 算法原理 142

4.2.3 实例说明 144

4.2.4 算法优缺点 147

4.2.5 优化改进 148

4.2.6 大数据适应度分析 149

4.2.7 地球科学应用案例 149

4.3 层次聚类算法 151

4.3.1 算法概要 151

4.3.2 距离度量 151

4.3.3 算法流程 153

4.3.4 改进优化 154

4.3.5 大数据适应度分析 158

4.3.6 地球科学应用案例 159

4.4 基于密度的聚类算法 160

4.4.1 算法概要 160

4.4.2 算法原理 160

4.4.3 实例说明 162

4.4.4 算法优缺点 164

4.4.5 优化改进 165

4.4.6 大数据适应度分析 166

4.4.7 地球科学应用案例 167

4.5 基于网格的聚类算法 168

4.5.1 算法概要 168

4.5.2 STING 168

4.5.3 CLIQUE 170

45.4 优化改进 173

4.5.5 大数据适应度分析 176

4.5.6 地球科学应用案例 177

参考文献 179

第5章 序列模式挖掘 183

5.1 GSP算法 184

5.1.1 算法概要 184

5.1.2 算法原理 184

5.1.3 实例说明 189

5.1.4 算法优缺点 191

5.1.5 GSP衍生算法 192

5.1.6 大数据适应度分析 194

5.1.7 地球科学应用案例 195

5.2 SPADE算法 196

5.2.1 算法概要 196

5.2.2 算法原理 197

5.2.3 实例说明 203

5.2.4 算法优缺点 206

5.2.5 优化改进 206

5.2.6 SPADE衍生算法 207

5.2.7 大数据适应度分析 209

5.2.8 地球科学应用案例 213

参考文献 215

第6章 深度学习 217

6.1 深度信念网 218

6.1.1 算法概要 218

6.1.2 算法原理 219

6.1.3 优化改进 225

6.1.4 大数据适应度分析 226

6.1.5 地球科学应用案例 227

6.2 卷积神经网络 228

6.2.1 算法概要 228

6.2.2 算法原理 228

6.2.3 实例说明 229

6.2.4 模型演化 231

6.2.5 优化改进 234

6.2.6 大数据适应度分析 235

6.2.7 地球科学应用案例 235

6.3 自动编码器算法 237

6.3.1 算法概要 237

6.3.2 算法原理 238

6.3.3 算法实现 240

6.3.4 衍生算法 241

6.3.5 优化改进 243

6.3.6 大数据适应度分析 244

6.3.7 地球科学应用案例 245

参考文献 245

第7章 异常检测 249

7.1 概述 250

7.2 基于统计的异常检测算法 251

7.2.1 算法原理 251

7.2.2 典型算法 251

7.3 基于距离的方法 252

7.3.1 算法原理 252

7.3.2 典型算法 252

7.4 基于深度的异常检测方法 256

7.4.1 算法原理 256

7.4.2 典型算法 257

7.5 基于密度的异常检测算法 258

7.5.1 算法原理 258

7.5.2 典型算法 258

7.6 基于偏离的异常检测算法 262

7.6.1 算法原理 262

7.6.2 典型算法 263

7.7 基于聚类的异常检测算法 265

7.7.1 算法原理 265

7.7.2 典型算法 265

7.8 大数据适应度分析 268

7.9 地球科学应用案例 269

参考文献 271

附录A软件、源码及开发包 275