基于温度时间序列的预白化建模方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shuangsssss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
气候变化对人类社会和自然系统有重要影响。气候不但是人类赖以生存的重要自然资源,还是人类活动的重要环境因素。近年来,随着温室效应与全球季候变暖的不断加剧,温度变化及其影响已成为当今社会各界普遍关注的热门话题,温度时间序列的分析与对未来温度的预测成为一个重要课题。温度时间序列具有显著的上升趋势、季节性特征。同时,随着热浪现象、极端天气的出现频率的增加,温度时间序列表现出显著的重尾现象。  温度观测数据是一种极其珍贵的采样数据,他们往往是一连串依时间推移而变化的数据记录,这种依时间坐标而排列数据的记录序列,通常称为数据的时间序列。温度数据时间序列如同其他自然科学的数据时间序列一样,蕴含着极其丰富的气象信息,我们须根据各自的研究目的和需要,设法提取那些具有规律性的气象信号而排除混杂其中的“噪声”干扰。  时间序列分析方法认为气象要素在随时间变化过程中任一时刻的变化前后是有关的,利用这种关系可以建立适当的数学模型来描述它们的变化规律,再利用所建立的方程做出预测。时间序列分析属于概率统计学科的一个分支,在金融、工业、气象等领域都有不错的应用,时间序列分析方法可以通过对有限的样本(数据)进行概率论方法的分析,建立具有一定精度的模型。  在温度时间序列的分析研究中,通常提到温度时间序列的周期性问题,比如年度周期、日周期。移除这个周期性趋势的过程被称为预白化。预白化方法还用来移除时间序列的序列相关性影响,它可以有效的找到序列的显著趋势。  本文主要介绍了时间序列的相关理论,并用预白化方法对最高温度的时间序列进行建模。对于温度时间序列中存在的缺省值,我们用插值方法进行替换。然后,用Mann-Kendall检验对测试最高温度时间序列进行检验,可以发现最高温度时间序列中存在的递增趋势。所以,我们从趋势、时间序列相关性和残差三方面考虑分析最高温度时间序列。在本文中我们用澳大利亚76074号温度站的每日最高温度数据。图3-1展示了每年平均气温图,从图中我们可以清晰的看到温度的增长趋势。Mann-Kendall检验的统计值为0.0314,同样为该温度序列的增长趋势提供了证据支持。  我们的预白化建模方法从趋势、时间序列相关性、以及残差三方面对温度时间序列进行建模。  第一步,我们对时间t进行正整数指数回归移除线性或非线性的趋势分析,通过趋势参数的显著性及标准差确定趋势的阶数。对澳大利亚最高温度时间序列的建模结果表明该温度时间序列具有二次趋势。  第二步,对移除趋势后的残差序列再次移除时间序列的相关性,在本文中我们使用自回归滑动平均模型。首先我们需要用AIC、BIC最小信息量准则确定该模型的阶数p和q(后面称为ARMA(p,q))。在ARMA(p,q)选择过程中,我们只考虑对残差Ljung-Box-Prierce检验的p值大于0.10,且具有最小的AIC信息量、BIC信息量的模型。对本文中的温度时间序列例子,同时考虑 ARMA(p,q)各参数的标准差,我们最终选择ARMA(2,9)模型。  最后,对预白化方法所得到的白噪声残差的趋势性、重尾性进行分析。通过与原始温度观测值序列、传统自回归滑动平均模型的对比分析,可以发现,预白化建模方法在移除时间序列的显著性趋势上具有明显优势,但在重尾特性上表现一般。  因而,在第三章的后半部分,我们分别仿真生成季节性时间序列、重尾时间序列,然后用预白化建模方法分别对季节性时间序列、重尾时间序列(单侧重尾时间序列、两侧重尾时间序列)进行建模,并对残差的趋势性、重尾性与传统自回归滑动平均模型进行对比分析。我们可以发现,预白化建模方法在趋势移除上具有显著优势,但对重尾现象的处理,效果甚微。  在本文第四章,综合考虑趋势、时间序列相关性以及残差,用最小二乘法(LS)和 Newton-Raphson方法确定相应的参数。并分别用简单预测方法(FC)、简单重采样(FCP)和移动窗口重采样方法(FCPMB)构造预测方法。综合考虑趋势及自回归滑动平均模型,用最小二乘法(LS)和Newton-Raphson方法确定相应的参数。在该部分中,我们使用2010年1月到2015年6月的数据,假设全部数据长度为m,我们使用前m?7个温度数据,预测接下来的一周的温度,并将预测过程进行10000次。然后,我们可以检验真是数据是否落在检测数据的95%预测区间内。综合考虑二次趋势以及 ARMA(2,9),用最小二乘法(Least-Square)及Newton-Raphson方法获得相应的参数及残差。然后结合确定的参数并结合残差重采样方法,确定预测模型。其中根据重采样方法的不同,共有三种预测方法,分别为:简单预测方法(FC)、简单重采样方法(FCP)、移动窗口重采样方法(FCPMB)。其中,简单预测方法忽略了残差的影响,即令预测的残差为零。简单重采样方法,假设预测长度为k,在残差中选取k个独立的残差。但残差间可能存在着某种我们未发现的相关性,因而,在残差中选取k个连续的残差,以保存这种相关性,这种方法即为移动窗口重采样方法。通过对FC方法、FCP方法与FCPMB方法预测结果的比较,可以发现FCPMB能得到较好的结果,原始温度数据均落在FCPMB方法与FCP方法的预测结果的95%区间内。FCPMB方法的区间稳定性明显优于FCP方法,但 FCP方法对连续一周的预测结果与真实观测值的拟合度更好。而 FC方法忽略了残差,预测结果单一,缺乏比较性。  我们需要对预白化预测方法进行简单的仿真。仿真的数据序列{xt}根据公式4.1产生,其中(此处为公式省略)代表趋势的部分,(此处为公式省略)代表ARMA部分。我们将公式4.1的模型称为T(k)-ARMA(p,q)模型,其中k代表趋势的阶数, p和q代表ARMA部分的阶数。并以T(1)-ARMA(1,1)为例介绍仿真过程,T(1)-ARMA(1,1)的表达式如4.5式所示,分别对FC方法、FCP方法和FCPMB方法求均方根预测残差,T(1)-ARMA(1,1)的仿真结果如表4-5所示,可以发现 FCPMB方法的平均值、中位数均小于 FCP方法,且 FCPMB比 FCP方法区间稳定性更好, T(1)-ARMA(1,2)、T(1)-ARMA(2,1)、T(1)-ARMA(2,2)、T(2)-ARMA(1,2)的仿真结果对FCPMB方法区间稳定性优于FCP方法的结论提供了佐证。在本文第五章,我们用CET月最高温度平均值数据对预白化方法进行验证分析,同样表明FCPMB方法区间稳定性优于 FCP方法,但 FCP方法在真实温度数据预测上的表现优于FCPMB方法。  综上,预白化方法在消除时间序列的趋势以及相关性方面是一种非常有效的手段。传统的自回归滑动平均模型,没有考虑到温度时间序列显著的增长性趋势,同时缺少对残差趋势性的检验。因而使用预白化方法建模,同时考虑趋势性、时间序列相关性、以及残差的相关性是非常必要的,但预白化建模方法在消除温度时间序列的重尾性上表现一般。本文对趋势的分析上,只考虑了线性趋势/二次趋势等幂律函数趋势,可以推广到指数型趋势、Gompertz型趋势、Logistic型趋势;对时间序列相关性上,可以结合ARCH等时间序列方法。同时,时间序列的重尾性也是一个非常值得探索的方向。
其他文献
脉冲现象作为一种瞬时突变现象,在现代科技各领域的实际问题中是普遍存在的.近年最新科技成果表明,这类系统在航天技术、信息科学、控制系统、通讯、生命科学、医学、经济领域均
Cahn-Hilliard方程最初用来模拟二元合金在淬火到一种不稳定状态时所发生的相分离现象,随着理论的发展,它在其它领域也得到广泛应用。例如Spinodal分解问题,Fickian扩散问题,二相
本文研究的是基于纵向数据的随机变系数模型: y=β(t)+x(t)β(t)+ε(t),j=1,…,m;i=1,…,n.其中β(t)=β(t)+γ(t),β(t)=β(t)+γ(t);β(t),β(t)是固定的时变函数系数,γ(t),γ(t)分
本文构造了一种用于求广义正则长波方程的数值解的高分辨率有限体积数值格式.广义正则长波方程是非线性方程,解析解通常难以求得,所以目前主要是研究其数值解.本文的研究目的就
向量值函数有理插值(简称向量有理插值)问题是Wynn于1963年提出的,他注意到:若将£算法应用到向量上并实施Samelson逆变换,就能得到如同数量一样的精确结果.GraYes-Morris从198