基于机器学习回归算法的地震预测研究及其在中国地震科学实验场的应用

来源 :中国地震局地震预测研究所 | 被引量 : 0次 | 上传用户:cyf1122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地震具有突发性和破坏性,会给人类带来巨大灾难和损失。地震预测是一个世界性的难题,国内外学者长期以来开展了多方面的地震预测研究,提出了一系列的地震预测模型,取得了长足的进展,但仍不能满足当今社会发展的急切需要。近年来,随着地震和地球物理观测手段的进步,地震观测数据在急剧增加,适用于大数据的机器学习方法在地震预测研究中展现了广阔的应用前景。本文在总结现有工作的基础上,以中国地震科学实验场为研究区域,以仪器记录地震目录为主要数据,开展基于机器学习回归算法的地震预测初步研究。本文首先对常用机器学习算法进行了总结和分析,并从中选择了广义线性模型(GLM)、基于CART决策树的随机森林模型(RF)和梯度提升机模型(GBM)以及深度神经网络模型(DNN)共4种机器学习算法构建地震预测模型;并采用Stacking集成学习算法对4种模型进行集成,采用交叉验证的方式构建次级线性学习器,对各单一模型的预测结果进行次级学习以提高预测效果。本文根据全国地震目录和川滇区域目录整理得到了实验场1970-2018年的地震目录,并基于川滇地区的地震活动性分区对实验场进行了地震区(带)的划分。考虑到区域地震台网监测能力时空差异造成的不完备地震目录会对地震活动性特征参数的计算造成影响,进而影响机器学习模型的预测效果,本文在总结国内外现有方法基础上,采用了震级—序号法、最大曲率法和拟合度检测法的组合方法对实验场最小完整性震级的时间演化特征和空间分布特征进行了分析,进而得到实验场分区域、分时段的最小完整性震级,并在本研究中统一确定最小完整震级为2.5。之后对常用的地震活动性特征参数进行了分析和比较,并选择了16个特征参数作为机器学习模型的输入变量,包括震级—频度分布类参数、地震频度类参数、地震能量类参数和综合类参数。采用了不同的窗口长度滑动计算特征参数构建数据集,在这些数据集上进行了机器学习模型的训练和测试,并对测试结果进行了比较。结果表明,构建数据集时采用的窗口长度对预测结果有较大影响,采用适应各地震区(带)地震活动性水平的可变窗口长度构建数据集,训练得到的各模型预测效果明显优于固定窗口的模型。之后采用4种评价指标对模型预测效果进行了分析和评价,包括绝对平均误差(MAE)、决定系数()、回归误差特征(REC)曲线及相应的曲线上面积(AOC)值和值评分。结果表明,RF模型在各模型中具有最好的预测效果;GBM模型效果较好,但次于RF模型;GLM模型和DNN模型效果较差;集成模型与RF模型较为接近,没有较大改善。各模型预测效果在4.0-6.9级地震震级之间效果较好,3.0-3.9级和7.0级以上次之,3.0级以下效果较差。各模型在各地震区(带)预测效果差异较大,其中松潘—龙门山带、龙陵区、澜沧—耿马区和思普区效果较好,阿坝区和理塘—木里区效果较差。各地震区(带)的各模型在各震级档的预测效果与实验场区域总体上的效果基本一致。RF模型和各集成模型的值评分相对较高,具有较好的预报效能,GBM模型和DNN模型次之,GLM模型较差。最后对所采用的地震活动性特征参数在4种单一模型中对预测结果的贡献度进行了分析。结果表明,震级—频度分布类贡献度较大,地震能量类参数次之,综合类参数再次,地震频度类参数相对较低;并且不同模型在不同的地震区(带),各特征参数的贡献度具有较大的差异。
其他文献
"天台三圣"是指丰干、寒山、拾得三位中唐天台山诗僧。自晚唐寒山子诗歌结集出版后,历宋、元、明、清各代而不衰;至明中叶才出现"和合二仙"形象。清雍正年间,雍正帝御封寒山、拾得为"和合二仙",使之成为中华和合文化的主要象征。
杜甫有大量内容丰富以"遣兴"为题的作品,突出体现了杜甫突破初盛唐较多吟咏山水林泉之"兴",将之扩展到日常生活中一切引发他创作的诗兴。"遣兴"诗题强调了创作对诗人情绪的排遣作用,杜甫在穷愁的漂泊生活中越来越清晰地认识到创作活动对他的意义,他的诗学思考及以诗论诗的形式正是在这个过程中产生的,并成为他"诗兴"的一种。以论诗来遣兴促使杜甫准确认识历代诗人的诗风特点和价值,成为诗歌史上的不刊之论。同时,杜甫
语文课程是小学教学中的重要内容,语文课程的意义在于给学生传授文学知识,为学生未来的学习奠定基础,让学生了解到中华民族数千年来的优秀文化,促进学生思想道德价值观念的形成。合作学习模式对小学语文阅读教学有很好的推动作用,但目前存在一些不足,所以小学语文教师要反思并完善合作学习模式的方方面面,以便今后更好地开展阅读教学工作。
现阶段,要想推动小学语文高年级阅读教学的发展,就必须紧跟时代潮流,将小组合作学习逐渐融入到课堂教学中,然后不断完善小学阅读教学体系,尊重学生之间的个人差异性,让学生取长补短,实现整个阅读教学的个性化发展,还应该在此基础上逐渐突破传统教学的桎梏。基于此,本篇文章对合作学习在小学高年级语文阅读教学中的应用进行研究,以供参考。
合作学习在小学语文阅读教学中的运用,符合新课标强调的学生主体地位,关注学生的学习能力、学习兴趣及语文素养,在合作学习中开启多元思维,夯实语文综合素养。因此小学语文阅读教学中开展合作学习具有积极意义,本文结合具体教学实例,探讨合作学习的应用价值和有益尝试。
本文使用高精度的重力/GNSS联测数据,对喜马拉雅东构造结处的雅鲁藏布江进行了研究,反演了河谷的地壳密度结构,计算了河谷均衡附加力,并通过水库蓄水导致的库仑应力变化的模拟结果,为拟建设水库的位置以及坝高给出参考意见。随后,本文使用Kriging插值模型对喜马拉雅东构造结自由空气重力异常的模型数据与融合数据的差异值进行了预测,发现通过Kriging插值模型修正后的自由空气重力异常更加接近实测值。主要
东昆仑断裂带是印度板块向欧亚板块俯冲过程中,在青藏高原内部沿东昆仑古构造缝合线形成的一条大型左旋走滑岩石圈断裂带,是巴颜喀拉块体与柴达木块体的分界活动断裂,全长约2000km。沿东昆仑断裂发生了很多7级以上强震,包括1937年托索湖7.5级,1963年阿拉克湖7级,2001年昆仑山口8.1级地震等。本文的研究区为此次大地震以东库赛湖-阿拉克湖段区域,东经93°到97.5°之间。这一地区走滑速率大,
2020年7~8月西藏波密易贡乡发生ML4.9显著震群,短短1个月时间内发生ML?4.0地震25次,引起广泛关注。本文以西藏波密地区震群活动为研究对象,全面总结波密震群区域以往地震活动特征,着重分析该局部区域震群活动与季节性降水等过程的相关关系,系统研究波密震群较大地震发生时间的潮汐调制特征,基于简单的一维流体渗透及孔隙压力扩散模型,结合降水过程、地理地貌、水系分布、介质及构造环境等因素,讨论震群
随着卫星时代的到来,通过电磁卫星对地球电离层各参量进行监测和分析已经成为地震预报的重要手段,在地震预报方向应用十分广泛。我国于2018年2月成功发射张衡一号电磁卫星,大量监测数据亟待处理。同时我国针对地基台站的观测也早已展开,已经有几十年的数据积累。目前地震预报的方法多数均为单一数据,将卫星数据和地基数据结合处理和分析的方法尚不成熟,很多有效的电离层震前扰动并未被充分利用。本研究使用中国地壳运动观
滇西南地区受多期岩浆活动和深大断裂的影响,地热资源丰富,地震活动性强。位于滇西南地区的南汀河断裂带是北东向弧形构造体系中规模最大、特征最明显断裂带。南汀河断裂带是滇西南地区地震活动最为强烈的断裂带之一,地热活动频繁,沿断裂带出露温泉数量多,适合作为地震地球化学监测点。为了研究云南省南汀河裂带温泉水文地球化学特征,本文通过温泉水的离子浓度及同位素组分数据分析了温泉水的来源、水化学类型、微量元素含量特