论文部分内容阅读
半参数面板计量经济模型是计量经济学领域的重要研究方向之一。该模型融合了参数面板数据模型与非参数面板数据模型的优点,不仅避免了非参数模型的“维数祸根”问题,而且与传统的参数面板数据模型相比,半参数面板数据模型具有更强的适应性和建模能力等特点。目前,该模型已在管理统计学、计量经济以及金融风险中得到了广泛应用,成为了处理多元回归问题的有力工具。在现实经济生活中,除了样本信息,我们还有可能对模型的参数向量有一些先验信息,利用这一先验信息可以提高参数估计的效率和准确性。然而,目前尚未有文献提出或考虑针对半参数面板数据模型中参数部分存在约束条件的估计方法。因此,在参数部分存在约束条件下,研究该模型中参数及非参数的约束估计具有重要的现实意义和理论价值。此外,随着数据的收集越来越容易,这导致数据库规模扩大,更具复杂性。例如各种类型的贸易交易数据、基因表达数据及多媒体数据等,它们的维度通常可以达到成百上千,甚至更高。正是由于高维数据的普遍存在,更加凸显了对该类型数据挖掘研究的重要意义和价值。但是,目前经典统计计量分析方法很难对高维数据进行深入全面的处理和分析。因此,研究高维面板数据模型的变量选择问题成为了计量经济学界不断探索的课题,也是本研究关注的主要问题之一。本文围绕半参数面板计量经济模型展开了系列研究。当参数部分存在线性约束条件时,提出了针对带固定效应的半参数部分线性面板数据模型的约束最小二乘估计方法,并证明了参数与非参数的约束估计均服从渐近正态分布。通过对模拟数据和重复模拟实验的分析,研究发现在参数存在约束条件的情况下,如果在估计参数与非参数时能考虑这一约束条件的影响,可以提高估计的精度和效率。变系数部分线性面板数据模型是半参数模型中另一类常见的模型,同时也是部分线性面板数据模型更为一般的的推广。该模型的特点是一部分自变量与因变量线性相关,而另一部分自变量则与因变量非线性相关。通过结合轮廓最小二乘方法,局部线性估计理论以及拉格朗日乘子方法,提出了对该模型中参数存在线性约束条件和无约束条件时的估计方法。此外,为了减少模型误差,在进行高维数据分析时通常会引入很多的变量。然而,其中的多数变量实际上是多余的,故为了提高模型的预测精度,需将这些无关变量从模型中剔除,即需要对模型进行变量选择。针对带测量误差的变系数部分线性面板数据模型,构造了半参数自适应Lasso惩罚函数。该方法可以同时选取对因变量影响显著的变量并估计其系数值。在一般的正则条件以及选取适当的扰动参数条件下,证明了该估计方法具有Oracle性质,且还给出了修正的LARS算法来求解目标函数。仿真模拟结果表明惩罚最小二乘估计在模型选择和参数估计中有非常好的表现。将上述考虑了的固定效应半参数面板计量经济模型应用到医疗保健支出与收入的关系研究中,实证分析了1995年—2009年42个非洲国家医疗保健支出与收入的关系。为了便于对比分析,本文同时给出了参数面板数据模型以及变系数面板数据模型的估计结果,并将42个非洲国家按世界银行的划分将其分成两类,分别研究了不同收入水平条件下医疗保健支出与收入之间的关系。研究结果表明:非洲国家的医疗保健支出的收入弹性小于1,即医疗保健支出的增长远远少于收入的增长。