论文部分内容阅读
作为对均值回归一个强有力的补充,分位数回归具有对异常点稳定,无需对随机误差有分布假设等优良特性.它最早是由Koenker和Bassett(1978)提出,在之后几十年中,越来越多的文献为分位数理论和应用做了推广(Koenker和Machado,1999;Koenker等,1994;Li和Zhu,2008;Liu和Wu,2011;Wang等,2013).贝叶斯方法由于其在有限样本下的优良表现以及参数自带的不确定性评估,在分位数的相关研究中占用重要地位.目前,有关贝叶斯分位数的相关课题已经有了不少的研究文献(Kottas和Krnjajic,2009;Li 等,2010;Reich 等,2011;Rodrigues 等,2019;Rodrigues 和Fan,2017;Thompson 等,2010).本文,我们在贝叶斯的框架下考虑分位数的三个不同的模型,分位数惩罚回归,单个分位数曲线拟合以及复合分位数曲线拟合.对于分位数惩罚回归以及单个分位数曲线拟合,我们主要针对现有文献中的不足加以理论上的说明和提出新的方法对不足加以修正.对于复合分位数曲线拟合,我们针对真实的分位数曲线是否平行提出了两种全新的贝叶斯方法来同时拟合多条分位数曲线,且我们的方法能保证拟合的分位数曲线不交叉.本文主要的工作列出如下:(1)针对贝叶斯分位数LASSO以及其拓展,我们系统地研究其先验的选择和后验的适当性等相关问题.我们指出其在现有文献中(Alhamzawi和Algamal,2019;Alhamzawi等,2019;Li等,2010)存在如下问题:(ⅰ),联合后验是多峰的;(ⅱ),后验的估计对超参数的选择敏感;(ⅲ),现有文献的模型不适用于对尺度参数使用客观先验.我们通过对回归参数提出新的先验来解决现有文献存在的问题,并给出了后验适当性的充要条件,该条件说明了我们的方法在观测值的个数小于参数个数的时候依然可以保证后验是存在的,而现有文献的方法则不能保证.此外,我们提出了“局部坍缩”的Gibbs抽样算法来提高计算效率.(2)针对贝叶斯分位数光滑样条,我们研究了其先验的选择,后验的适当性以及理论的推广等问题.贝叶斯分位数光滑样条最早由Thompson等(2010)提出,但是由于他们将尺度参数视为定值,所以可能会导致贝叶斯分位数估计在分位数远离0.5的时候表现不佳(Santos和Bolfarine,2016).此外,我们在数值模拟的过程中发现Thompson等(2010)的方法对光滑参数的估计不稳定,这导致拟合的曲线要么过度平坦,要么过度拟合.为了改善这个问题,我们系统地研究了对尺度参数加客观先验时联合后验的适当性.我们得到后验适当性的条件且把理论结果推广到了含无观测值节点的情形.此外,数值模拟结果和实际数据的分析都表明了我们方法的优越性.(3)我们研究了复合分位数曲线拟合的贝叶斯分析.假定我们需要拟合多条分位数曲线,若用上述单个分位数曲线方法逐个拟合,得到的不同分位数曲线可能会交叉,这违背了分位数函数关于分位数递增的基本事实,该问题被称为分位数的“交叉问题”(crossing problem).如何解决交叉问题是分位数回归和曲线拟合中的热门话题(Cher-nozhukov,2005;Dette和Volgushev,2008;He,1997;Muggeo 等,2013;Rodrigues 等,2019;Rodrigues和Fan,2017).我们提出了两个全新的模型去处理分位数交叉的问题,第一个模型假设分位数曲线之间是平行的;第二个模型假设分位数曲线之间是非平行的.首先,我们提出了全新的最小化问题,该最小化问题不仅保证得到分位数曲线是非交叉的,而且允许分位数曲线之间充分共享信息;其次,为了在贝叶斯的框架下处理最小化问题,我们给出对应的先验,伪似然函数,以及后验分布的Gibbs抽样算法.此外,我们采用蒙特卡洛期望-最大值算法来选择惩罚参数.模拟的结果显示我们的方法在极端分位数曲线拟合上较现有方法具有明显的优势.