第一章 数据挖掘与知识发现的概述 1
第一节 数据挖掘引论 2
一、数据挖掘的原动力 2
二、数据挖掘的任务和内容 2
三、数据挖掘系统的分类 3
四、地学数据挖掘的特殊性 4
第二节 可进行数据挖掘的数据系统 5
一、数据库 5
二、数据仓库 7
三、数据银行 8
第三节 数据挖掘系统 9
一、系统功能 10
二、系统流程 11
三、数据预处理 11
四、算法概述 12
第二章 概率与统计 14
第一节 概率 16
一、应用范围及条件 16
二、基本原理 16
三、用概率密度函数预测未发现的资源 18
四、用蒙特卡罗法计算某个地质参数 20
第二节 统计 25
一、应用范围及条件 25
二、基本原理 25
三、用最小二乘法求一个地质参数表达所研究的另一个地质参数的关系式 28
四、用多元回归分析求多个地质参数表达所研究的另一个地质参数的关系式 34
第三章 人工神经网络 41
第一节 人工神经网络方法 43
一、应用范围及条件 44
二、基本原理 44
三、BP模型 48
四、简单应用实例1:用ANN进行原油产量的预测 55
五、简单应用实例2:用ANN进行压裂酸化效果的预测 57
第二节 应用实例1:含油气圈闭勘探价值的综合评价 59
一、研究问题 59
二、输入数据 62
三、ANN、MRA两种算法的应用比较 62
四、小结 63
第三节 应用实例2:利用常规测井资料预测裂缝 64
一、研究问题 64
二、输入数据 64
三、ANN、MRA两种算法的应用比较 64
四、小结 67
第四章 支持向量机 69
第一节 支持向量机方法 71
一、应用范围及条件 72
二、基本原理 72
三、C-支持向量机二分类算法 73
第二节 应用实例1:基于孔渗饱的含气性评价 75
一、研究问题 75
二、输入数据 78
三、SVM、ANN、MRA三种算法的应用比较 78
四、小结 79
第三节 应用实例2:基于测井资料解释的含油性评价 80
一、研究问题 80
二、输入数据 81
三、SVM、ANN、MRA三种算法的应用比较 81
四、小结 83
第四节 采用机器学习的降维算法 83
一、降维的定义和意义 83
二、降维的方法 84
三、降维的实例 84
四、小结 85
第五章 决策树 87
第一节 决策树方法 89
一、应用范围及条件 90
二、基本原理 90
三、 ID3算法 90
四、C4.5算法 94
五、简单应用实例:购买计算机问题 94
第二节 应用实例1:顶煤冒放性评价(29个学习样本) 99
一、研究问题 99
二、输入的己知参数 101
三、学习过程 101
四、DTR、SVM、ANN、MRA四种算法的应用比较 102
五、小结 104
第三节 应用实例2:顶煤冒放性评价(26个学习样本、3个预测样本) 105
一、研究问题 105
二、输入的已知参数 106
三、学习过程 106
四、预测过程 108
五、DTR、SVM、ANN、MRA四种算法的应用比较 108
六、小结 110
第六章 贝叶斯分类 112
第一节 贝叶斯分类方法 115
一、应用范围及条件 116
二、贝叶斯定理 116
三、朴素贝叶斯算法 116
四、贝叶斯判别算法 119
五、贝叶斯逐步判别算法 122
六、简单应用实例:贷款拖欠问题 126
第二节 应用实例1:储层分类 132
一、研究问题 132
二、输入的己知参数 133
三、学习过程 133
四、判别BAC、逐步判别BAC、SVM、ANN、MRA五种算法的应用比较 134
五、小结 135
第三节 应用实例2:煤与瓦斯突出预测 136
一、研究问题 136
二、输入的己知参数 137
三、学习过程 137
四、预测过程 138
五、判别BAC、逐步判别BAC、SVM、ANN、MRA五种算法的应用比较 139
六、小结 140
第四节 应用实例3:含油气圈闭勘探价值的综合评价 141
一、研究问题 141
二、输入的己知参数 141
三、学习过程 141
四、预测过程 141
五、逐步判别BAC、SVM、ANN、MRA四种算法的应用比较 143
六、小结 144
第五节 应用实例4:基于测井资料解释的含油性评价 144
一、研究问题 144
二、输入的已知参数 145
三、学习过程 145
四、预测过程 145
五、逐步判别BAC、SVM、ANN、MRA四种算法的应用比较 145
六、小结 147
第七章 聚类分析 149
第一节 聚类分析方法 151
一、应用范围及条件 151
二、基本原理 152
三、Q型聚类分析 153
四、R型聚类分析 160
第二节 应用实例1:探明储量的相关地质参数 160
一、研究问题 160
二、输入数据 161
三、计算结果及结果分析 161
四、小结 164
第三节 应用实例2:含油气圈闭评价参数 164
一、研究问题 164
二、输入数据 166
三、计算结果及结果分析 166
四、小结 168
第四节 应用实例3:测井资料解释 170
一、研究问题 170
二、输入数据 172
三、计算结果及结果分析 172
四、小结 174
第八章 克立格法 176
第一节 预处理 177
第二节 实验变差函数 181
一、应用范围及条件 181
二、基本原理 181
三、用实验变差函数描述地质参数的分布特性 182
第三节 实验变差函数的最优拟合 186
一、应用范围及条件 186
二、基本原理 186
三、用球状模型实现实验变差函数的最优拟合 187
第四节 克立格法的交叉验证 192
一、应用范围及条件 192
二、基本原理 193
三、用扇形区最近点法实现克立格法的交叉验证 193
第五节 克立格法的应用 199
一、应用范围及条件 199
二、基本原理 199
三、用平面最近点法实现克立格法的应用 200
第六节 小结 205
第九章 其他地学软计算 206
第一节 模糊 207
一、应用范围及条件 207
二、基本原理 208
三、用模糊综合评判法确定地质目标的优劣 208
第二节 灰色 211
一、应用范围及条件 211
二、基本原理 211
三、用灰色预测法进行时空推算 212
四、用灰色综合评判法确定地质目标的优劣 217
第三节 分形几何 224
一、应用范围及条件 224
二、基本原理 224
三、用分形几何法定量描述地质构造特征 225
第四节 线性规划 228
一、应用范围及条件 228
二、基本原理 228
三、用线性规划实现勘探开发方案的最优化 230
参考文献 239
附录1常用专业词汇中英文对照表 245
附录2计量单位换算表 249