论文部分内容阅读
广义Pareto分布(Generalized Pareto Distribution,GPD)在极值理论中极其重要,其广泛应用于金融和水文等领域.如,GPD可用于模拟洪水等极端现象的相关数据.在可靠性和生物医学上,具有非单调失效率函数(failure rate function,frf)的数据相当常见,但GPD只能拟合具有单调失效率的数据,没有充分的理由利用GPD拟合该类数据.因此,对GPD进行推广,使其能更好地拟合具有非单调失效率函数的数据是有实际意义.论文根据广义Beta(Beta Generalized,BG)分布的思想对三参数GPD 进行推广,得到 Beta 广义 Pareto 分布(Beta Generalized Pareto Distribution,BGPD),增加的两个形状参数α和β用来调整分布的形状,主要是分布的偏度和双侧尾部的厚度,以便能更好地拟合更多类型实际数据的分布.论文主要研究GPD的推广理论及BGPD的统计推断问题.在分布的推广方面,首先利用BG思想构造BGPD的分布函数,从而得到分布的概率密度函数以及失效率函数,给出分布的多种特殊形式,例如,当α=β=0.5时,该分布被推广为arcsin分布.然后,利用极限理论讨论该分布的概率密度函数f(x),失效率函数h(x)的重要特征,如k<0,0<α≤1,0<β≤1时,BGPD的失效率函数为浴盆曲线形状等.针对分布在经济学中有广泛应用,特别是基尼系数这一重要指标.通过PWM方法计算BGPD的Gini系数的期望值等.在参数估计方面,讨论了 BGPD总体参数的四种常用的矩(类)估计方法,包括:矩法(Method of moments,MOM),概率加权矩(Probability Weight Moments,PWM),L-矩(L-Moments,L-M)和边缘 L-矩(Trim L-Moments,TL-M),以及极大似然估计(Maximum Likelihood Estimation,MLE)问题,建立各类估计方程,讨论估计方程求解问题及解(估计量)的性质,证明参数极大似然估计的渐近正态性等.对所论及的参数估计方法进行模拟对比研究,并讨论各种估计的估计性质和效果.结果表明,随着形状参数β和样本量n的增大,PWM,L-M和TL-M三者间的估计效果相差不大.在拟合优度检验方面,讨论基于TTT(The Total Time on Test,TTT)图思想的BGPD拟合优度检验法,利用分布的二阶L-M与形状参数σ间存在线性关系的特征,构造基于检验统计量λ2/σ的BGPD拟合优度检验新方法,讨论该方法的使用前提及检验效果.通过计算,发现GPD,BP(Beta Pareto,BP),Pareto和三参数Weibull分布的二阶L-M与尺度参数σ也都具有线性关系,但各分布的线性关系的系数均不相同,故可构造新的检验统计量L2来比较各分布的拟合效果,发现L2越小,拟合效果越好的结论.在可靠性上,样本总测试时间TTT图能够反映样本对应的失效函数的单调性,如若TTT图像是先下凸后上凸,则该数据的失效函数具有浴盆曲线形状.为检验该推广分布能否更好的拟合具有非单调失效函数的数据,针对Choulakian和Stephens(2001)文献中加拿大某河流的超阈值洪峰数据,据数据的TTT图像具有浴盆曲线形状的特征,初步判断用BGPD拟合研究数据的分布可能适宜.通过比较BGPD,GPD,BP,Pareto 和三参数 Weibull 分布拟合数据的 BIC(Bayesian Information Criterion,BIC),AIC(Akaike Information Criterion,AIC),CM(Cram-rvon Mises)和 WA(Watson)值,发现用BGPD拟合所研究数据的分布效果最好.这验证了 BGPD具有很好的使用性.