论文部分内容阅读
摘 要:为研究薪酬水平的影响因素以及与这些因素之间是否存在线性关系,以R语言中自带数据集wgge1为例,借助R语言提供的丰富高效的统计模型处理方法,对wage1数据集中薪酬与教育水平、工作经验以及婚姻状况等因素进行分析,建立影响薪酬水平的回归模型。基于此,在指出模型分析中不足的同时,也提出了几点现实的参考意见。
关键词:薪酬水平;R语言;回归分析
中图分类号:F069;C936 文献标志码:A 文章编号:1673-291X(2021)23-0057-03
引言
薪酬是组织优化人力资源的有效杠杆,理论界目前对薪酬结构与其影响因素的实证研究也还存在很大空间。同时,随着大数据的兴起,作为由统计学教授Ross·Ihaka 和Robert·Gentleman开发的用于统计分析、绘图的语言和操作环境的一种软件,R语言迅速成为一种热门的数据分析工具。因其具有强大的数据处理能力和持续扩展能力,处理统计和测量问题的方法也越来越丰富,覆盖范围也越来越广[1],所以我们以R语言中自带数据集wgge1为例,在认真查阅和分析资料的前提下,利用R语言这一软件,分析wooldridge包中的wage1数据集中的数据分布情况。
一、数据集描述性分析及数据说明
wage1数据集是由著名的经济学家杰弗里·伍德里奇和亨利·法伯尔在就读于麻省理工学院时,从1976年美国人口现状调查中所收集的关于劳动力薪酬情况。
(一)数据集描述性分析
wage1数据集中包含526行和24列。也就是说,该数据集是对样本为n=526人所作出的24项调查,wage1数据集中共含有24个变量。
(二)数据说明与变量处理
结合研究主题和相关文献的研究,拟采用的变量包括薪酬、教育水平、工作经验、婚姻状况、家属人数及居住区域等。变量具体设定如表1。
二、R语言环境下回归模型的建立与分析
对于薪酬水平与其影响因素的關系,已有许多学者做出了相关研究。叶勤等人对企业的薪酬环境、组织环境和员工具体所从事工作的性质对员工薪酬水平的影响进行了研究,认为环境因素与薪酬水平和满意度之间有显著相关关系[2]。Lawler 和 Edward认为,总体报酬以员工需求为导向的本质,突出了企业利益与个人利益协调、共赢的思想,对员工工作积极性、离职率和其他关键行为发挥着积极的影响[3]。基于此,在wage1数据集中,为了更加细致清楚地描述薪酬与所选变量之间的关系,我们建立薪酬与研究变量之间的回归方程。
(一)建立简单线性回归模型
利用wooldridge包中的wage1中n=526 个人的数据,估计薪酬与教育水平之间是否存在线性关系,建立如下的回归模型1,即总体回归方程为:
W=β0+β1educ+εi(1)
同时建立半对数的回归模型2,其回归方程为:
ln(W)=β0+β1educ+εi(2)
模型1、2中,W代表每小时薪酬水平,β0和β1是回归系数,εi是误差项,是其他一切不确定因素的总和。我们用参数为formula模型公式,函数lm会估计回归系数β0和β1,分别用Intercept和x表示,可得模型中回归方程的参数水平和判决系数(见表2、表3)。在此数据的基础之上,进一步分析所做回归模型的合理性,并对模型回归结果进行分析。
显然,调整之后模型2中的判决系数Multiple R-squared为0.185 8,其值并不接近于1,回归结果也是不理想的;但同时,p-value=2.2e-16,与模型1相比没有变化。我们无法判断哪个模型更好,因此,影响薪酬的因素不只是有教育水平,可能还有其他方面的,比如工作经验、婚姻状况等。为了更好解释影响薪酬的因素,我们就必须用到多元回归模型。
(二)建立多元线性回归模型
在数据集wage1中,我们建立wage与educ、exper以及married之间的多元线性回归模型3,其回归方程为:
W=β0+β1educ+β2exper+β3married+εi(3)
同时,在模型3的基础之上建立模型4,其多元线性回归方程为:
log(W)=β0+β1educ+β2exper+β3married+εi(4)
从回归结果来看,模型3、模型4拟合的效果相对于模型1、模型2的效果还是不错的。常数项以及educ、exper的预测效果较为显著,married的预测能力较好。同时,如表5所示,模型3的判决系数为0.240 1,模型4的判决系数为0.275 8,与模型1中相比较大,回归系数也是较为显著的,但仍偏离1较远。我们用AIC函数来判断4种模型哪一个的拟合效果更好,见表6。
综合以上四种模型,对简单回归模型而言,我们只能说模型2比模型1 的拟合效果好,但不能说模型2中薪酬与教育水平具有显著的共线性关系。同样,对多元回归模型而言,也不能得出薪酬与教育水平、工作年限或者婚否这些因数之间存在明显的线性关系。因此,我们预测,薪酬是由多方面因素影响的,若将教育水平、工作经验、当前工作任期、婚否、家属人数、居住区域等因素都考虑起来,其回归方程的拟合效果会更好,可解释性会更大。 三、研究結论与建议
通过构建的模型分析我们发现,影响薪酬水平的因素不单单是教育水平、工作经验等中的哪一个,每一个因素都有可能会是造成薪酬不同的重要因素,而且多种因素间的相互作用才更有可能准确影响薪酬。追求薪酬公平是最个体作为社会人最基本的要求,是企业吸引和激励员工的基础保障结合研究内容,因此从影响薪酬的多种因素出发,为构建公平合理的薪酬体系,我们从以下三个方面提出建议。
(一)提倡性别平等
深受我国重男轻女这一几千年的封建思想的影响,女性的企业职场道路相对会比较坎坷。虽然研究中的数据是以美国为例,但我们知道,美国也同样存在着性别歧视。这些历史问题不仅对20世纪五六十年代的美国劳动力就业情况产生了影响,同时也是影响当前中国男女就业情况的重要因素。因此,从性别劳动力市场看,政府应逐步建立一种公平的市场机制,以保障在市场上寻找工作并具有相同生产效率的女性劳动者能得到同等的对待[4]。
(二)缩小城乡差异
美国的劳动力就业来源区域有很大差别,对于来自大城市、东西部中心与郊区的就业者来说就业情况是不一样的。而在我国,城乡发展不协调也在一定程度上影响劳动力就业的均衡性[5]。虽然各地都有自己的最低工资标准暂行条例,但是法律效力不强,对企业的约束力不够,从而使其无法起到缩小薪酬差距的作用,尤其是对一些能力较弱、学历层次较低的农村就业者而言。
(三)均衡教育水平
教育水平对于一个国家快速发展的重要性不言而喻。在当前阶段,我国仍需坚持科教兴国、人才强国战略,继续推进教育制度的改革,加大教育的投资力度,促进教育的公平性,优化各级教育配置的结构[6]。
四、研究局限
本研究利用wage1数据集分析研究影响薪酬水平的因素,得到了一些现实的结论。但仍存在着以下几点局限性和需要改进的地方。
第一,文章所使用的数据含有较多的离散,在某种程度上可能会影响研究结果的稳健性。
第二,由于数据规模较小,仅仅粗略地研究了影响薪酬水平的因素,并没有细分行业分割或职业分割所引起的差异。
第三,wage1数据集的收集年份较为久远且与我国的劳动力就业水平有一定的差距,因此,该数据分析的结果会影响现代人力资源管理中研究薪酬的影响因素的参考作用。
因此,在未来的研究中,我们期望获得更加准确且具有时效性的数据来丰富薪酬水平与其影响因素之间关系的研究,从而获得更系统性的解释。
参考文献:
[1] 杨中庆.基于R语言的空间统计分析研究与应用[D].广州:暨南大学,2006.
[2] 叶勤,戴大双,王海波.环境因素对薪酬满意度的影响研究:一个中国移动通信运营企业的市政[J].科技管理研究,2008,(3).
[3] Lawler,III,and E.Edward.Creating a New Employment Deal: Total Tewards and the New Workforce[J].Organizational Dynamics,2011,40(7):302-309.
[4] 吕康银,朱金霞,张丽.性别收入差距及影响因素研究——以吉林省为例[J].东北师范大学学报,2013,(4):163-167.
[5] 邢春冰.农民工与城镇职工的收入差距[J].管理世界,2008,(5):55-64.
[6] 彭竞.高等教育回报率与工资的性别差异[J].人口与经济,2011,(4):51-57.
[责任编辑 张宇霞]
收稿日期:2021-01-18
作者简介:邓多杰(1994-),女,硕士研究生,从事创新管理研究;张峥(1972-),男,山东泰安人,教授,博士,从事创新战略管理研究。
关键词:薪酬水平;R语言;回归分析
中图分类号:F069;C936 文献标志码:A 文章编号:1673-291X(2021)23-0057-03
引言
薪酬是组织优化人力资源的有效杠杆,理论界目前对薪酬结构与其影响因素的实证研究也还存在很大空间。同时,随着大数据的兴起,作为由统计学教授Ross·Ihaka 和Robert·Gentleman开发的用于统计分析、绘图的语言和操作环境的一种软件,R语言迅速成为一种热门的数据分析工具。因其具有强大的数据处理能力和持续扩展能力,处理统计和测量问题的方法也越来越丰富,覆盖范围也越来越广[1],所以我们以R语言中自带数据集wgge1为例,在认真查阅和分析资料的前提下,利用R语言这一软件,分析wooldridge包中的wage1数据集中的数据分布情况。
一、数据集描述性分析及数据说明
wage1数据集是由著名的经济学家杰弗里·伍德里奇和亨利·法伯尔在就读于麻省理工学院时,从1976年美国人口现状调查中所收集的关于劳动力薪酬情况。
(一)数据集描述性分析
wage1数据集中包含526行和24列。也就是说,该数据集是对样本为n=526人所作出的24项调查,wage1数据集中共含有24个变量。
(二)数据说明与变量处理
结合研究主题和相关文献的研究,拟采用的变量包括薪酬、教育水平、工作经验、婚姻状况、家属人数及居住区域等。变量具体设定如表1。
二、R语言环境下回归模型的建立与分析
对于薪酬水平与其影响因素的關系,已有许多学者做出了相关研究。叶勤等人对企业的薪酬环境、组织环境和员工具体所从事工作的性质对员工薪酬水平的影响进行了研究,认为环境因素与薪酬水平和满意度之间有显著相关关系[2]。Lawler 和 Edward认为,总体报酬以员工需求为导向的本质,突出了企业利益与个人利益协调、共赢的思想,对员工工作积极性、离职率和其他关键行为发挥着积极的影响[3]。基于此,在wage1数据集中,为了更加细致清楚地描述薪酬与所选变量之间的关系,我们建立薪酬与研究变量之间的回归方程。
(一)建立简单线性回归模型
利用wooldridge包中的wage1中n=526 个人的数据,估计薪酬与教育水平之间是否存在线性关系,建立如下的回归模型1,即总体回归方程为:
W=β0+β1educ+εi(1)
同时建立半对数的回归模型2,其回归方程为:
ln(W)=β0+β1educ+εi(2)
模型1、2中,W代表每小时薪酬水平,β0和β1是回归系数,εi是误差项,是其他一切不确定因素的总和。我们用参数为formula模型公式,函数lm会估计回归系数β0和β1,分别用Intercept和x表示,可得模型中回归方程的参数水平和判决系数(见表2、表3)。在此数据的基础之上,进一步分析所做回归模型的合理性,并对模型回归结果进行分析。
显然,调整之后模型2中的判决系数Multiple R-squared为0.185 8,其值并不接近于1,回归结果也是不理想的;但同时,p-value=2.2e-16,与模型1相比没有变化。我们无法判断哪个模型更好,因此,影响薪酬的因素不只是有教育水平,可能还有其他方面的,比如工作经验、婚姻状况等。为了更好解释影响薪酬的因素,我们就必须用到多元回归模型。
(二)建立多元线性回归模型
在数据集wage1中,我们建立wage与educ、exper以及married之间的多元线性回归模型3,其回归方程为:
W=β0+β1educ+β2exper+β3married+εi(3)
同时,在模型3的基础之上建立模型4,其多元线性回归方程为:
log(W)=β0+β1educ+β2exper+β3married+εi(4)
从回归结果来看,模型3、模型4拟合的效果相对于模型1、模型2的效果还是不错的。常数项以及educ、exper的预测效果较为显著,married的预测能力较好。同时,如表5所示,模型3的判决系数为0.240 1,模型4的判决系数为0.275 8,与模型1中相比较大,回归系数也是较为显著的,但仍偏离1较远。我们用AIC函数来判断4种模型哪一个的拟合效果更好,见表6。
综合以上四种模型,对简单回归模型而言,我们只能说模型2比模型1 的拟合效果好,但不能说模型2中薪酬与教育水平具有显著的共线性关系。同样,对多元回归模型而言,也不能得出薪酬与教育水平、工作年限或者婚否这些因数之间存在明显的线性关系。因此,我们预测,薪酬是由多方面因素影响的,若将教育水平、工作经验、当前工作任期、婚否、家属人数、居住区域等因素都考虑起来,其回归方程的拟合效果会更好,可解释性会更大。 三、研究結论与建议
通过构建的模型分析我们发现,影响薪酬水平的因素不单单是教育水平、工作经验等中的哪一个,每一个因素都有可能会是造成薪酬不同的重要因素,而且多种因素间的相互作用才更有可能准确影响薪酬。追求薪酬公平是最个体作为社会人最基本的要求,是企业吸引和激励员工的基础保障结合研究内容,因此从影响薪酬的多种因素出发,为构建公平合理的薪酬体系,我们从以下三个方面提出建议。
(一)提倡性别平等
深受我国重男轻女这一几千年的封建思想的影响,女性的企业职场道路相对会比较坎坷。虽然研究中的数据是以美国为例,但我们知道,美国也同样存在着性别歧视。这些历史问题不仅对20世纪五六十年代的美国劳动力就业情况产生了影响,同时也是影响当前中国男女就业情况的重要因素。因此,从性别劳动力市场看,政府应逐步建立一种公平的市场机制,以保障在市场上寻找工作并具有相同生产效率的女性劳动者能得到同等的对待[4]。
(二)缩小城乡差异
美国的劳动力就业来源区域有很大差别,对于来自大城市、东西部中心与郊区的就业者来说就业情况是不一样的。而在我国,城乡发展不协调也在一定程度上影响劳动力就业的均衡性[5]。虽然各地都有自己的最低工资标准暂行条例,但是法律效力不强,对企业的约束力不够,从而使其无法起到缩小薪酬差距的作用,尤其是对一些能力较弱、学历层次较低的农村就业者而言。
(三)均衡教育水平
教育水平对于一个国家快速发展的重要性不言而喻。在当前阶段,我国仍需坚持科教兴国、人才强国战略,继续推进教育制度的改革,加大教育的投资力度,促进教育的公平性,优化各级教育配置的结构[6]。
四、研究局限
本研究利用wage1数据集分析研究影响薪酬水平的因素,得到了一些现实的结论。但仍存在着以下几点局限性和需要改进的地方。
第一,文章所使用的数据含有较多的离散,在某种程度上可能会影响研究结果的稳健性。
第二,由于数据规模较小,仅仅粗略地研究了影响薪酬水平的因素,并没有细分行业分割或职业分割所引起的差异。
第三,wage1数据集的收集年份较为久远且与我国的劳动力就业水平有一定的差距,因此,该数据分析的结果会影响现代人力资源管理中研究薪酬的影响因素的参考作用。
因此,在未来的研究中,我们期望获得更加准确且具有时效性的数据来丰富薪酬水平与其影响因素之间关系的研究,从而获得更系统性的解释。
参考文献:
[1] 杨中庆.基于R语言的空间统计分析研究与应用[D].广州:暨南大学,2006.
[2] 叶勤,戴大双,王海波.环境因素对薪酬满意度的影响研究:一个中国移动通信运营企业的市政[J].科技管理研究,2008,(3).
[3] Lawler,III,and E.Edward.Creating a New Employment Deal: Total Tewards and the New Workforce[J].Organizational Dynamics,2011,40(7):302-309.
[4] 吕康银,朱金霞,张丽.性别收入差距及影响因素研究——以吉林省为例[J].东北师范大学学报,2013,(4):163-167.
[5] 邢春冰.农民工与城镇职工的收入差距[J].管理世界,2008,(5):55-64.
[6] 彭竞.高等教育回报率与工资的性别差异[J].人口与经济,2011,(4):51-57.
[责任编辑 张宇霞]
收稿日期:2021-01-18
作者简介:邓多杰(1994-),女,硕士研究生,从事创新管理研究;张峥(1972-),男,山东泰安人,教授,博士,从事创新战略管理研究。