基于分位数回归的变量选择和异方差识别

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:ry0205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
普通最小二乘(OLS)是回归中重要的参数估计方法,在满足某些条件时有着良好的理论性质和结论.但该方法存在一定的缺陷,比如对异常值不稳健.分位数回归(QR)旨在估计响应变量的分位数函数,对异常值稳健,且理论性质不需要太强的假设条件,被广泛应用到参数估计,模型识别,变量选择等问题.进一步地,组合分位数回归(CQR)方法同时考虑了多个分位数,提高了估计效率.随着变量选择方法的发展,将QR方法与变量选择方法结合,如基于lasso的分位数回归(LQR)方法和同时多分位数回归(SMQR)方法.这两种方法分别结合lasso和L∞的惩罚函数,通过压缩系数实现模型选择,但估计结果不具有oracle性质.调整的LQR(ALQR)方法和调整的SMQR(ASMQR)方法则在惩罚项中添加权重,通过对系数施加不同力度的惩罚使得估计结果具有oracle性质.这些方法虽然有效地实现了参数估计和模型选择,但未对模型异方差做出讨论.通常,QR方法假设指定了模型结构,即模型中的变系数和常数系数已知,本文考虑在模型结构未知的情况下,估计模型系数,进行变量选择.进一步地,本文将通过惩罚方法识别模型中的常系数和变系数,解决模型结构未知的问题,同时也对模型的异方差性做出了讨论.本文的主要内容共有四章.第一章介绍了国内外对于QR方法以及基于QR的变量选择方法的研究现状.第二章是本文的主要部分,包括模型介绍和主要结果.在这一章中,我们提出了LCQR方法,该方法在CQR方法的基础上结合adaptive group lasso惩罚的变量选择方法,同时估计多个分位数模型的系数,并且保留模型中的重要变量.进一步地,LCQR方法还考虑了不同分位数模型下对应系数之间的关系,通过常数效应的惩罚方法找到模型中的变系数和常系数,识别模型异方差.本章最后,我们给出了严格的理论证明,证明了估计结果具有相合性和稀疏性,第三章是数值模拟和实例分析部分,我们分别在同方差和异方差的线性模型下进行了数值模拟,最终得到了良好的结果.为了说明本文提出的方法在实际情况中的有效性,本文用LCQR方法对Boston住房数据进行了分析,并最终说明了本文方法可以实现变量选择和识别模型异方差.第四章对本文进行了总结.
其他文献
学位
目前,农业资源总体趋紧、环境污染问题突出、农业生态系统进一步退化等问题使我国现代化农业发展走向瓶颈阶段,农业绿色化转型迫在眉睫。为平衡农业发展和生态环境与民众需求
产业园区的企业服务和配套建设是新时期我国经济和社会转型升级发展所面临的重要问题,服务质量的好坏和配套建设的完善程度,决定着产业园区运营效果,进而影响产业的发展走向
敦煌地处甘肃的西北部,位于河西走廊的最西端,正好处于甘肃、青海、新疆三省的交汇处,成为古丝绸之路的交通要道。独特的地理位置造就了独特的文化艺术。在现当代,众多艺术家都尝试挖掘敦煌壁画艺术的各种元素,最常见的形式就是利用壁画中的元素加以重构,产生新的画面效果,或者使用壁画中的色相进行新的艺术创作。除此之外,随着科技的发展,越来越多的的艺术家将传统壁画元素与科技(例如数码成像、新型材料技术等)相结合,
学位
学位
随着我国汽车行业进入稳健增长时期,行业集中度提升,产业整合、并购重组规模不断提高。现阶段,汽车产业链存在专业化分工不足、企业协作关系水平低、产业链环节布局散乱等问
目前,国有企业混合所有制改革正加快推进,逐渐从文件转化为落地的改革措施,从试点探索转向整体推进,成为国企改革的重要突破口。分析混合所有制改革给企业带来的经济后果,明
高熵合金作为一种新兴材料,由于具有不同于传统金属的四个核心效应自从报道以来就备受关注:热力学上的高熵效应、晶体学上的晶格畸变效应、动力学上的缓慢扩散效应和“鸡尾酒
赣东北蛇绿混杂岩位于扬子板块与华夏板块的交接部位,是中国东南部为数不多确定的新元古代蛇绿岩,蕴含着江南造山带乃至华南前寒武纪大地构造演化的重要信息。本项研究,我们
BD公司是专注于为用户提供全面系统家庭娱乐解决方案与服务的国家级高新技术企业;通过多年的市场开发、产品自主研发、生产效率优化等努力,成为广电市场中的龙头企业,积累了