关于分位数惩罚回归和光滑样条的贝叶斯分析

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:lxp3754
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为对均值回归一个强有力的补充,分位数回归具有对异常点稳定,无需对随机误差有分布假设等优良特性.它最早是由Koenker和Bassett(1978)提出,在之后几十年中,越来越多的文献为分位数理论和应用做了推广(Koenker和Machado,1999;Koenker等,1994;Li和Zhu,2008;Liu和Wu,2011;Wang等,2013).贝叶斯方法由于其在有限样本下的优良表现以及参数自带的不确定性评估,在分位数的相关研究中占用重要地位.目前,有关贝叶斯分位数的相关课题已经有了不少的研究文献(Kottas和Krnjajic,2009;Li 等,2010;Reich 等,2011;Rodrigues 等,2019;Rodrigues 和Fan,2017;Thompson 等,2010).本文,我们在贝叶斯的框架下考虑分位数的三个不同的模型,分位数惩罚回归,单个分位数曲线拟合以及复合分位数曲线拟合.对于分位数惩罚回归以及单个分位数曲线拟合,我们主要针对现有文献中的不足加以理论上的说明和提出新的方法对不足加以修正.对于复合分位数曲线拟合,我们针对真实的分位数曲线是否平行提出了两种全新的贝叶斯方法来同时拟合多条分位数曲线,且我们的方法能保证拟合的分位数曲线不交叉.本文主要的工作列出如下:(1)针对贝叶斯分位数LASSO以及其拓展,我们系统地研究其先验的选择和后验的适当性等相关问题.我们指出其在现有文献中(Alhamzawi和Algamal,2019;Alhamzawi等,2019;Li等,2010)存在如下问题:(ⅰ),联合后验是多峰的;(ⅱ),后验的估计对超参数的选择敏感;(ⅲ),现有文献的模型不适用于对尺度参数使用客观先验.我们通过对回归参数提出新的先验来解决现有文献存在的问题,并给出了后验适当性的充要条件,该条件说明了我们的方法在观测值的个数小于参数个数的时候依然可以保证后验是存在的,而现有文献的方法则不能保证.此外,我们提出了“局部坍缩”的Gibbs抽样算法来提高计算效率.(2)针对贝叶斯分位数光滑样条,我们研究了其先验的选择,后验的适当性以及理论的推广等问题.贝叶斯分位数光滑样条最早由Thompson等(2010)提出,但是由于他们将尺度参数视为定值,所以可能会导致贝叶斯分位数估计在分位数远离0.5的时候表现不佳(Santos和Bolfarine,2016).此外,我们在数值模拟的过程中发现Thompson等(2010)的方法对光滑参数的估计不稳定,这导致拟合的曲线要么过度平坦,要么过度拟合.为了改善这个问题,我们系统地研究了对尺度参数加客观先验时联合后验的适当性.我们得到后验适当性的条件且把理论结果推广到了含无观测值节点的情形.此外,数值模拟结果和实际数据的分析都表明了我们方法的优越性.(3)我们研究了复合分位数曲线拟合的贝叶斯分析.假定我们需要拟合多条分位数曲线,若用上述单个分位数曲线方法逐个拟合,得到的不同分位数曲线可能会交叉,这违背了分位数函数关于分位数递增的基本事实,该问题被称为分位数的“交叉问题”(crossing problem).如何解决交叉问题是分位数回归和曲线拟合中的热门话题(Cher-nozhukov,2005;Dette和Volgushev,2008;He,1997;Muggeo 等,2013;Rodrigues 等,2019;Rodrigues和Fan,2017).我们提出了两个全新的模型去处理分位数交叉的问题,第一个模型假设分位数曲线之间是平行的;第二个模型假设分位数曲线之间是非平行的.首先,我们提出了全新的最小化问题,该最小化问题不仅保证得到分位数曲线是非交叉的,而且允许分位数曲线之间充分共享信息;其次,为了在贝叶斯的框架下处理最小化问题,我们给出对应的先验,伪似然函数,以及后验分布的Gibbs抽样算法.此外,我们采用蒙特卡洛期望-最大值算法来选择惩罚参数.模拟的结果显示我们的方法在极端分位数曲线拟合上较现有方法具有明显的优势.
其他文献
研究背景与研究目的近年来,随着HIV/AIDS疫情不断蔓延,艾滋病在我国的主要传播方式发生了较大变化,在部分经济较发达地区,男男性行为人群(Men who have Sex with Men,MSM)已经成为主要感染人群。我国MSM人群通常具有多性伴及安全套使用率低的特点,携带不同亚型病毒的感染者间交叉传播,加剧了HIV-1基因的多样性,开展分子流行病学监测有助于及时掌握本地HIV-1疫情现状。耐
三维数字图像相关(Three dimensional digital image correlation,3D-DIC)方法是一种无损非接触的全场变形测量方法,被广泛应用于诸多测量领域。系统标定与图像匹配是影响测量精度的关键技术,关于标定与匹配的误差分析也日益完善成熟,但对于系统整体误差量化评估以及误差传递等问题,目前仍缺乏系统的研究。同时,随着电子、生物、材料等领域的快速发展,微尺度下的测量需求
智能收获机自主作业系统具有负载实时变化、执行机构复杂、作业环境差异明显等非线性特点,研究智能收获机的非线性运动控制方法能有效提高收获机运动控制的准确性、鲁棒性和稳定性。针对智能收获机非线性运动控制技术中存在的输入饱和特性、输入延迟特性、模型参数不确定性等非线性问题,建立收获机非线性运动控制系统组合模型,提出基于卫导/惯导的组合导航补偿方法、考虑输入饱和的神经网络非线性运动控制方法及考虑输入时延的预
随着社会经济发展,各种商务活动越来越频繁,涉及的范围也越来越大。商务礼仪在商务活动中占据非常重要的地位,保持良好的礼仪,能够增进商务活动中人员的感情,有助于提高商务活动的成功率,提升企业在商务活动中的形象,为企业创造更多的商业机会。且商务礼仪不仅能在商务活动中促进友好合作、交往与谈判成功,维护企业与个人形象,还对个人未来职业发展有着十分重要的影响作用,关乎个人的发展空间。基于此,本文首先对商务礼仪
学位
桥梁工程在国家交通建设中起着重要的作用。包括桥梁挠度、拉索振动等在内的结构动静变形是桥梁鉴定、危桥改造和新桥验收的重要测量内容和关键研究参数。致力于解决大型桥梁结构变形指标难测量、测不准等工程难题,微波雷达、测量机器人、激光三位扫描和光学成像等高新测量技术在土木工程领域内逐渐被广泛应用。其中光学成像技术以其定位精细、多点同步、动静态均可胜任以及非接触无损测量的多重优势倍受关注。虽然该技术已经被广泛
锂硫电池比传统锂离子电池具有更高的理论能量密度,是最具前景的下一代储能器件之一。然而,锂硫电池的大规模应用依然受到以下几方面的制约:1)电极活性物质的低电导率导致电化学反应动力学迟缓;2)中间产物多硫化物的溶解和扩散导致活性物质的流失;3)体积效应导致电极的稳定性差甚至失效等。本论文从抑制锂硫电池的穿梭效应出发,以极性的MXene(d-Ti3C2)作为导电骨架和前驱体,构筑多级结构的硫载体,以期优
学位
纤维增强复合材料(Fiber Reinforced Polymer,FRP)的超高比强度、超强耐久性和优异的可设计性使其较好地满足了现代桥梁工程对轻质、高强、耐久的需求,国内外既有研究表明拉挤成型工艺是最为经济也最适合于桥梁工程规模化生产的成型方法。目前拉挤成型FRP已在国内外桥梁工程中得到较广泛应用,采用FRP拉挤型材作为桥梁主承力构件成为热门研究方向之一。其用于桥梁工程目前存在两大技术瓶颈:(
背景与目的目前,通过无创性方法产前检测单基因病仍是很困难的,这是由于母体血浆中的胎儿游离DNA只占母体血浆游离DNA的10%左右。理想的单基因病筛查技术应做到不需要父母致病位点和连锁SNPs位点,直接诊断胎儿基因型,一次性检测多个突变位点。我们研发了一种叫做游离DNA标记后单分子检测(cfDNA barcode-enabled single-molecule tes,cfBEST)的新技术可以满足