论文部分内容阅读
普通最小二乘(OLS)是回归中重要的参数估计方法,在满足某些条件时有着良好的理论性质和结论.但该方法存在一定的缺陷,比如对异常值不稳健.分位数回归(QR)旨在估计响应变量的分位数函数,对异常值稳健,且理论性质不需要太强的假设条件,被广泛应用到参数估计,模型识别,变量选择等问题.进一步地,组合分位数回归(CQR)方法同时考虑了多个分位数,提高了估计效率.随着变量选择方法的发展,将QR方法与变量选择方法结合,如基于lasso的分位数回归(LQR)方法和同时多分位数回归(SMQR)方法.这两种方法分别结合lasso和L∞的惩罚函数,通过压缩系数实现模型选择,但估计结果不具有oracle性质.调整的LQR(ALQR)方法和调整的SMQR(ASMQR)方法则在惩罚项中添加权重,通过对系数施加不同力度的惩罚使得估计结果具有oracle性质.这些方法虽然有效地实现了参数估计和模型选择,但未对模型异方差做出讨论.通常,QR方法假设指定了模型结构,即模型中的变系数和常数系数已知,本文考虑在模型结构未知的情况下,估计模型系数,进行变量选择.进一步地,本文将通过惩罚方法识别模型中的常系数和变系数,解决模型结构未知的问题,同时也对模型的异方差性做出了讨论.本文的主要内容共有四章.第一章介绍了国内外对于QR方法以及基于QR的变量选择方法的研究现状.第二章是本文的主要部分,包括模型介绍和主要结果.在这一章中,我们提出了LCQR方法,该方法在CQR方法的基础上结合adaptive group lasso惩罚的变量选择方法,同时估计多个分位数模型的系数,并且保留模型中的重要变量.进一步地,LCQR方法还考虑了不同分位数模型下对应系数之间的关系,通过常数效应的惩罚方法找到模型中的变系数和常系数,识别模型异方差.本章最后,我们给出了严格的理论证明,证明了估计结果具有相合性和稀疏性,第三章是数值模拟和实例分析部分,我们分别在同方差和异方差的线性模型下进行了数值模拟,最终得到了良好的结果.为了说明本文提出的方法在实际情况中的有效性,本文用LCQR方法对Boston住房数据进行了分析,并最终说明了本文方法可以实现变量选择和识别模型异方差.第四章对本文进行了总结.