第1章 绪论 1
1.1 科学研究第四范式 1
1.2 地球科学数据 3
1.3 大数据挖掘的基本任务 7
1.4 大数据挖掘建模过程 8
1.5 常用数据挖掘建模工具 10
第2章 数据清洗与预处理 15
2.1 数据清洗 15
2.2 数据集成与融合 19
2.3 数据变换 22
2.4 数据规约 26
2.5 离群点检测 31
2.6 Python主要数据预处理函数 37
第3章 高维数据的降维 44
3.1 相关分析 44
3.2 典型相关分析 47
3.3 哈希算法 51
3.4 主成分分析 56
3.5 因子分析 58
3.6 Python算法实现 64
3.7 应用案例 69
第4章 分类与预测 73
4.1 回归分析 73
4.2 聚类分析 84
4.3 判别分析 97
4.4 关联规则算法 102
4.5 推荐系统算法 108
4.6 Python算法的实现 114
第5章 图形数据处理 129
5.1 计算机图形基础 129
5.2 数字图像处理 134
5.3 图像模式识别 139
5.4 大图形的社区结构识别 142
5.5 基于图的拓扑结构相似度的地质文献与信息检索 150
5.6 实现图形数据处理的算法 155
第6章 无限流数据与时间序列 159
6.1 无限流数据与时序模式 159
6.2 无限流数据特征提取 160
6.3 时间序列算法 163
6.4 Python算法的实现 171
第7章 机器学习与深度学习 177
7.1 机器学习的发展史 177
7.2 机器学习分类 178
7.3 SVM 180
7.4 决策树 183
7.5 人工神经网络 188
7.6 深度学习 192
7.7 迁移学习 200
7.8 Python算法的实现 203
第8章 贝叶斯原理与人工智能地质学 208
8.1 贝叶斯原理 208
8.2 人工智能 209
8.3 智能矿床成矿与找矿模型 210
8.4 基于大数据智能鉴定矿物岩石实验 211
附录Ⅰ Python入门 221
1.1 搭建Python开发平台 221
1.2 Python使用入门 222
1.3 Python数据分析工具 231
附录Ⅱ TipDM-PB数据挖掘建模平台 240
2.1 新建工程入门 240
2.2 使用模板入门 249
参考文献 251