论文部分内容阅读
支持向量机作为基于统计学习理论的新的机器学习技术,采用了结构风险最小化原则和核函数的思想,能够较好的解决小样本、高维数、非线性等问题。因此,近年来支持向量机理论得到深入研究,并在预测预报、建模与控制等许多领域得到了广泛的应用。本文利用支持向量机及其一些改进的算法对云南地区的地震时间和震级进行预测,并检验了预测结果。主要研究内容如下:(1)通过收集和统计云南地区历年地震的时间和震级,提取出能反映地震脉动信息的地震活动因子,建立原始的数据集,然后根据设定的阈值,把样本分成正类和负类,用分类的方法进行预测。当设置的阈值较小时,我们可以预测小震或中强震。此时针对数量不平衡的正类和负类样本,我们提出了利用AHC过采样和有偏支持向量机相结合的方法(AHC-BSVM)进行分类和预测。实验结果表明AHC-BSVM与传统的标准支持向量机或有偏支持向量机相比,能获得更高的分类准确率,具有更好的预测效果。实验还表明AHC-BSVM对小震的预报准确率要高于中强震,误警率低于中强震。(2)当设置的阈值较大时,我们可以预测强震。此时在正类和负类样本极不平衡的情况下,我们提出采用一类分类的支持向量机进行分类和预测。首先阐述传统的球体一类分类支持向量机(SOCC)和改进的椭球体一类分类支持向量机(HOCC)的主要思想,接着分别利用AHC-BSVM、SOCC和HOCC对强震进行预测。实验结果表明在正负类样本极不平衡的情况下,HOCC比SOCC和AHC-BSVM的分类预测效果要好,运用HOCC预测强震能够提高预报准确率,降低误警率。而且在采用相同的分类器时,RBF核的分类预测效果要优于多项式核。(3)用回归的方法预测时,我们以年为待预测时间段,把云南地区历年地震的最大震级看成一个时间序列,利用ε-支持向量回归机预测地震震级并检验了预测结果。实验表明该预测模型的输入维数与ε-支持向量回归机的相关参数的选取对预测效果有较大的影响,我们需要采用一些特定的评测指标和优化规则才能使模型的预测性能有所提高。此外,在设置了适当的参数的情况下,ε-支持向量回归机的预测效果要优于BP神经网络,虽然待预测的时间段较长,但是预测的准确率要高于AHC-BSVM或HOCC分类的方法。本文所提出的地震预测模型对地震虽然不能全部做出准确预报,有一定的漏报和误报,但是还是可以识别和预报出相当一部分特定震级范围的地震,这为防震减灾工作提供了参考,也为机器学习应用于地震预测提供了新思路。