论文部分内容阅读
为了快速有效的获取砂岩型铀矿矿区铀矿异常的分布信息,矿区岩性分布的基础资料,本文以砂岩型铀矿异常和不同岩性类别的地球物理测井响应特征为理论依据,利用集成机器学习方法—随机森林算法的非线性映射能力、决策分类能力,以已知铀矿异常信息和岩性录井定名的特征信息为训练样本,针对研究区构建基于随机森林算法的铀矿异常识别和岩性分类模型。对松辽盆地大庆长垣南端某铀矿矿区铀矿钻孔测井数据进行异常层和矿化层的识别提取以及岩性的分类识别,并将随机森林算法的识别结果与已知矿化层的特征信息进行验证分析。为了解决超参数的影响问题,采用遍历寻优的思路对随机森林算法的超参数进行筛选,利用最优算法参数组合进行分类识别。结果表明:在岩性识别中,随机森林决策树棵数为563棵,决策树节点个数为3个时,算法结构最优,识别准确率最高。训练样本的训练数据袋外误差验证准确率为93.39%,预测样本的预测准确率为93.31%。通过对比分析,随机森林算法的预测准确率优于支持向量机方法和BP神经网络方法,研究区内9口钻孔的预测准确率平均可达92.25%。根据随机森林算法的参数重要性分析:电阻率和自然电位对研究区岩性分类的贡献更大,密度和放射性测井重要性较低。在铀矿异常识别工作中:随机森林算法的袋外误差验证准确率为97.63%,通过变量筛选后可提升至97.97%。预测准确率99.21%,应用效果较好。矿化层以及异常层的识别结果同已知矿化层的特征信息重合度高。在等比例数据条件下,算法模型的训练数据袋外误差验证准确率和预测准确率分别为93.96%和94.8%。对于地质现象的学习能力较强,快速有效,相较于传统铀矿异常识别方法而言更加接近铀矿异常分布的真实形态。本文研究结果表明随机森林算法是岩性识别应用、铀矿异常识别应用中可靠的新方法,应用于铀矿勘查及其相关地质工作中具有良好的前景。本论文针对研究目标所做内容主要如下:(1)对研究区的区域地质概况和测井资料进行深入分析,选取了电阻率、自然伽马、密度、声波时差、定量伽马、自然电位、三侧向电阻率和井径共计8个特征参数,分析砂岩型铀矿异常的测井响应规律和不同岩性类别的测井响应规律。(2)构建针对研究区钻孔测井数据的随机森林算法识别模型,对研究区内的钻孔测井数据进行岩性自动分类。(3)构建针对研究区含矿目的层的随机森林算法识别模型,对研究区内的钻孔测井数据进行铀矿异常的识别提取。(4)将随机森林算法识别模型的岩性分类结果同BP神经网络和支持向量机方法的预测结果相比较。并分别分析了三种方法的优缺点和适应性。(5)将随机森林方法应用于研究区的铀矿异常工作中,通过变量重要性筛选提升算法性能,同传统的铀矿勘查方法作对比,取得了不错的效果。