论文部分内容阅读
改革开放以来,我国的经济得到了极大的发展,国内生产总值由改革开放前的人均381元增长到了如今的人均70891.78元,国民生产总值的极大增长意味着人民生活水平的巨大提升。但正如库兹涅茨曲线所指出的那样,随着收入水平的提高,我国的收入差距却在逐渐扩大,整体经济表现出强烈的二元化特点,收入两极化的情况也日益严重。通常情况下,我们使用基尼系数来测度国家的收入差距情况,但目前关于基尼系数的计算方法较多且各有利弊。本文简单回顾了目前在估计基尼系数时使用的方法,并对如何更加精确的估计基尼系数提出了新的观点。本文首先简要介绍了洛伦兹曲线及基尼系数的相关性质。主要包括洛伦兹曲线的形式,数学定义,基尼系数与洛伦兹曲线的关系等;之后文章回顾了现有的基尼系数的估计方法:几何方法、协方差方法、平均差方法与矩阵方法,这四种方法计算基尼系数的关键都在于对收入分布函数或者洛伦兹曲线的估计。目前我们常用洛伦兹函数法与经验分布法来估计对应的收入分布函数或洛伦兹曲线,但此两种方法都存在一定的局限性。因此对于应该如何更加精确且简便的计算基尼系数,这一问题目前尚无定论。为了解决基尼系数的估计精度问题,本文从洛伦兹函数法入手来优化对分组数据的估计。本文认为传统的估计方法的问题在于仅仅考虑了对分组数据的最优拟合(即使估计的残差平方和最小)而忽视了分组数据所对应的微观数据特征如同均值、方差等的匹配问题,这就导致了在洛伦兹曲线的估计过程中,对参数洛伦兹函数的选取具有一定的任意性。而如果在对分组数据的估计中考虑到其对应的微观数据的特点与洛伦兹函数的函数特点之间是否匹配,就可以针对不同收入特点的数据使用不同的洛伦兹函数,从而在一定程度上提高估计的精确度。基于此本文从微观数据的均值及方差与洛伦兹函数之间的关系入手,找到了均值在洛伦兹曲线上对应的点,并基于此点的分布情况,提出洛伦兹函数的灵活性的概念。本文认为,对于一个参数洛伦兹函数,当其参数的变化时,洛伦兹函数一二阶矩的范围越大,此洛伦兹函数就越灵活,某一洛伦兹函数的灵活性较强意味着可以用此函数来估计更多不同的收入分布情况。如果存在一个可以适用于各种不同的收入分布数据的洛伦兹函数,就可以使用这一函数估计各国基尼系数从而减小函数因函数选择问题带来的系统性误差。相应的,我们提出使用人均收入分界常数(mean-income division constant,简记为MDC)和Pietra比率来量化参数洛伦兹函数的灵活性的方法。在确定了洛伦兹曲线灵活性的概念之后,我们首先对所有的单参数洛伦兹函数进行了梳理,并使用灵活性的概念研究了单参数模型的灵活性情况。结果发现,因为单参数模型的参数较少,单个参数显然无法满足我们使用正交的两个指标来研究灵活性的条件,因此其灵活性较差。对于多参数洛伦兹函数,多参数模型因为参数的增加而变得更加复杂,因此我们在在穷尽所有参数组合之后求出各个洛伦兹函数一阶矩与二阶矩的可能范围,并通过其范围的大小判断多参数洛伦兹函数灵活性的强弱。在研究了所有的参数洛伦兹函数之后,我们发现,虽然洛伦兹函数纷繁多样,但目前还不存在一种可以适用于各种不同的收入分布数据的洛伦兹函数,这也意味着在传统做法中,仅仅使用某一个洛伦兹函数来计算各种不同收入分布情况的基尼系数这一做法是值得商榷的。最后本文对中国的收入分配数据进行了研究。结果发现,我们可以在一定程度上使用Hossain,Saeki模型来研究中国的收入分布情况,并用此函数计算出了一组基尼系数。本文的主要意义在于:理论上,本文提出了一种优化对洛伦兹函数估计的方法,将参数估计中的洛伦兹函数法与分布函数法相结合,提出应该根据函数特点与数据特点的匹配选择洛伦兹函数,此方法在一定程度上解决了洛伦兹曲线法因数据量较小带来的系统估计误差与数据特点与函数特点不能匹配而造成的函数选取误差;在应用层面上,本文重新计算了我国的基尼系数,这一更加精确地基尼系数有助于更好的理解我国的收入分布情况,为相关的减贫政策提供一定的支持。本文的创新之处在于:本文认为,在使用洛伦兹函数法估计洛伦兹曲线并进一步求解基尼系数的过程中,仅仅关注曲线对分组数据的拟合效果是远远不够的。这一做法忽视了对分组数据所对应的微观数据的某些特征值的拟合,反过来说,分组数据的最优拟合也无法说明对分布函数特征值如均值与方差的最优拟合。如果没有考虑微观数据的整体分布情况,仅仅使用样本量及其有限的分组数据来估计洛伦兹函数显然是会造成较大的误差。为了解决此问题,我们提出洛伦兹曲线灵活性的概念,以更加精确的估计洛伦兹曲线及基尼系数。