论文部分内容阅读
摘要:生产企业在实施延伸生产者责任制(EPR)中,有可能与审查人伙同串谋,产生“搭便车”问题,导致国家利益受损。通过构建生产企业、审查人和政府主管部门的三方演化博弈模型,分析影响三方博弈均衡的重要因素,探讨生产企业与审查人串谋行为的产生条件,提出有针对性的解决对策。
关键词:延伸生产者责任制(EPR);串谋;演化博弈
中图分类号:F224.1;F270 文献编码:A DOI:10.3969/j.issn.1003-8256.2016.03.004
1 引言
现代社会大量的废弃工业产品因得不到合理的处理而造成了资源浪费和环境污染。环境负外部性问题绝不仅仅是少数经济活动偶然的副产物,其根源于市场、社会和政府力量所构架的经济决策活动之中[1]。为了应对日益严重的环境问题,1988年,瑞典环境经济学家托马斯(Thomas.Lindhquist)提出生产者延伸责任(Extended Producer Responsibility,简称“EPR”)的概念,被经合组织(OECD)和欧盟(EU)认为是最有希望解决废弃产品和其污染问题的手段之一[2]。EPR是一种基于“污染者付费”的环境保护策略,主张将生产者的责任延伸到产品消费后的回收、处理和最终处置阶段,以达到产品生命周期环境绩效最优的结果[3]。
2008年我国全国人大颁布《循环经济促进法》确立在我国实施生产者延伸责任制度,在此前后,众多学者结合国情探讨了实施EPR制度的相关问题。例如,赵一平、付小勇、郑云虹等从不同角度构建了完全信息情境下,政府和核心企业的静态和和动态演化博弈模型,描述了政府与核心企业的互动关系,以及政府应采取的激励机制[4-6];王兆华、尹建华等指出回收制度及法规对企业回收废弃电器电子产品行为有显著影响[7];钟永光等从整合非正式回收者的角度得出,政府对非法拆解征收环保费用或者提高有资质回收企业的回收价格,可以激励回收小商贩参与环保拆解[8]。
国外学者对EPR的研究成果更为丰富,2000年,托马斯的题为《清洁生产中的延伸生产者责任》的博士论文,阐述了EPR的背景、内涵、目标、实施方式、以及各国的实践经验。[9]随后出现了大量关于EPR议题的研究,经合组织(OECD)在2001、2004和2005年分别出版了《EPR:政府工作指引》、《EPR 经济分析》以及《EPR项目的成本收益评估分析框架》,通过对各国EPR的实施情况进行评价,总结了EPR实施项目中存在的问题以及实践启示。托马斯的原创理论研究以及OECD的后续实践工作,成为各国学者继续开展EPR研究的基础。Sander和Tojo等总结了欧盟电子废弃物(WEEE)实施情况,[10]Akenjin和Manomaivibool以及Dwivedy等探讨了泰国、印度和其它一些亚洲国家的EPR实施情况[11-13],其中学者们共同关注了生产企业在实施EPR制度中的“搭便车”(Free Rider)问题。“搭便车”是指生产企业逃避履行延伸责任从而不付出相应成本的行为,德国“Dual System”回收系统曾因生产企业的“搭便车”损失惨重,[3]缅甸也将其视为影响EPR实施效果的重要因素。
目前,我国已在废弃电子产品、汽车、包装物等领域推行生产者延伸责任制,但针对我国国情,如何管理应对EPR制度下生产商与审查人的串通问题,探讨尚不充分。因此,本文运用演化博弈论分析工具,构建生产者、审查人和政府的三方博弈模型,通过分析博弈均衡条件,提出针对性的对策建议。
2 演化博弈模型的构建
2.1 模型的基本假设与收益矩阵
EPR制度将生产者责任延伸到产品消费后阶段,审查人对生产企业的EPR义务履行情况进行核查,并对政府主管部门上报企业EPR的实施情况,企业若不能通过审查就需要缴纳废弃产品处理基金,其生产成本将被迫提高。因此,为规避履行EPR义务带来的成本,某些生产企业可能与审查人员发生串谋活动。为避免这种情况,政府主管部门可能需要花费额外的人财物力对企业和审查人的活动加以监督,由此形成了生产企业、审查人和政府主管部门的三方博弈。该三方博弈模型建构的基本假设是(各参数含义如表1所示):
(i)生产企业串谋成本需小于因被审查发现而被迫履行EPR所增加的成本,即,否则其无串谋动机;
(ii)政府主管部门若监管良好,则一定能够发现生产企业和审查人的串谋行为。
政府主管部门选择监管策略时,若生产企业和审查人发生串谋行为,则勒令违规生产企业履行EPR义务并予以罚款,另外针对企业和审查人的串谋行为分别进行处罚;若生产企业和审查人不发生串谋行为,则政府主管部门浪费审查成本,但获得生产企业不履行EPR义务的罚没收入。
政府主管部门选择不监督策略时,若生产企业和审查人发生串谋行为,“搭便车”发生,政府主管部门将被迫承担废弃产品的回收处理成本;若生产企业和审查人不发生串谋行为,审查人按企业实际情况上报,未履行EPR义务的生产企业将被迫履行义务并支付罚款,政府主管部门获得生产企业不履行EPR义务的罚没收入。
博弈三方的收益矩阵如表2所示。
2.2 模型的建立
现实中,生产企业、审查人和政府主管部门均不能保证准确判断对方的策略选择,更为普遍的是各自采取混合策略,即各方均以某种概率分布来确定自己的行动方案,从而达到一种混合策略均衡。在均衡条件下,任何一方单独改变自己的策略都不可能给自己带来额外收益。我们用演化博弈求解均衡点,假设生产企业与审查人群体选择串谋的比例为x,则不串谋的比例为1-x;政府主管部门选择监督的比例为y,则选择不监督的比例为1-y。根据三方博弈收益矩阵可知:
生产企业选择与审查人串谋的期望收益:
生产企业选择不与审查人串谋的期望收益: 生产企业群体混合策略1的平均收益:
政府主管部门选择监管的期望收益:
政府主管部门选择不监管的期望收益:
政府主管部门群体混合策略的平均收益:
3 演化博弈均衡分析
3.1 生产企业与审查人群体“串谋”比例的复制动态方程
生产企业与审查人群体“串谋”比例的复制动态方程为:
当时,,取任何值,博弈均为稳定状态。
当时,令,是两个稳定点。
对求导,。
进化稳定策略(ESS)要求。
当时,,所以,因此是稳定点,生产企业会趋向于选择不与审查人串谋;
当时,,
所以,因此是稳定点,生产企业会趋向于选择与审查人串谋。
生产企业与审查人群体在Y三种不同取值情况下的策略选择的动态趋势及其稳定性如图1所示。
3.2 政府主管部门群体“监管”比例的复制动态方程
当时,,取任何值博弈均为稳定状态。
当时,令,是两个稳定点。
对求导,。
进化稳定策略(ESS)要求。
当时,,
所以,因此是稳定点,政府主管部门会趋向选择监督;
当时,,
所以,因此是稳定点,政府主管部门会趋向选择不监督。
政府主管部门群体在X三种不同取值情况下的动态趋势及其稳定性如图2所示。
3.3 三方演化博弈稳定分析
3.3.1 三方演化博弈均衡解
将三方群体复制动态趋势置于坐标平面上表示,如图3所示。分析得出4种均衡状态:
(1)当初始状态落在A区域时,该博弈收敛于平衡点,即:(串谋,不监督)是企业、审查人和政府主管部门三个博弈群体中所有参与者的必然选择;
(2)当初始状态落在B区域时,该博弈收敛于平衡点,即:(串谋,监督)是企业、审查人和政府主管部门三个博弈群体中所有参与者的必然选择;
(3)当初始状态落在C区域时,该博弈收敛于平衡点,即:(不串谋,监督)是企业、审查人和政府主管部门三个博弈群体中所有参与者的必然选择;
(4)当初始状态落在D区域时,该博弈收敛于平衡点,即:(不串谋,不监督)是企业、审查人和政府主管部门三个个博弈群体中所有参与者的必然选择;
根据Friedman[15]提出的方法,一个微分方程系统描述的群体动态,其均衡点的稳定性可由系统的雅可比(Jacobi)矩阵的局部稳定性分析得到:若矩阵的行列式值为正且迹为负,则局部均衡点为演化稳定策略(ESS);若矩阵的行列式和迹的值都为正,则为不稳定点;若矩阵的行列式为正且迹为0,则为鞍点。博弈的雅克比矩阵如下:
对4个均衡点进行稳定性分析如表3:
3.3.2 参数分析
(1)根据基本假设(ii),可知,,值不确定,(0,0)为鞍点。
(2)任何情况下,(0,1)点均为不稳定点。
(3)当且时,
如果,即,
那么(1,0)点为稳定点,企业与审查人串谋,政府主管部门不监管;
如果,那么(1,0)点为鞍点;
如果,那么(1,0)点为不稳定点。
(4)当时,恒成立,那么(1,1)恒为不稳定点。
4 结论与建议
本文研究得出以下几点结论:
第一,通过参数分析(3)发现,如果政府主管部门的监督成本过大,超过所有罚金及生产企业实施EPR成本之和的最大值,政府主管部门会采取不监督策略,那么生产企业和审查人会去选择串谋,也就是说,政府主管部门应将监管成本控制在的范围内,否则将不利于对串谋活动的规避。为了改善这种状况,政府主管部门需要努力降低监管成本,改良现有监管机制或引入先进管理办法;但如果串谋行为发生数量较大,则可以考虑提高相关惩处金额等办法加大惩罚力度,予以解决。
第二,根据假设(ii)可知,若,即生产企业与审查人的串谋成本过高时,串谋活动便不会发生,因此可知,可以通过改良审查机制等手段,为生产企业与审查人的串谋活动制造障碍,从而更为有利的避免此类“搭便车”现象的发生。
第三,演化博弈各群体对各自策略的初始选择比例对最终结果产生相异的均衡结果,因此政府主管部门应加强EPR的宣传教育,使生产企业和审查人充分理解实施EPR对于社会和环境的重要意义,从可持续发展角度思考自己的行为,并以此衡量自身的长期利益。
第四,对所有生产企业而言,若,也就是说企业能从实施EPR中获益,“搭便车”即可完全杜绝。因此,政府主管部门可以通过激励措施,积极引导企业发展“循环利用技术”,高效利用废弃产品,提高EPR的实施效果。
注释:
1 在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略(pure strategy)。如果在每个给定信息下只以某种概率选择不同策略,称为混合策略.
参考文献:
[1] 赵一平,朱庆华,傅泽强. 产品导向环境管理制度的发展与思考[J]. 科技进步与对策,2008(8):122-125.
[2] Nnorom I C,Osibanjo O. Overview of electronic waste (e-waste) management practices and legislations, and their poor applications in the developing countries[J]. Resources, conservation and recycling, 2008,52(6): 843-858. [3] Lifset R, Atasu A, Tojo N. Extended Producer Responsibility [J]. Journal of Industrial Ecology,2013,17(2): 162-166.
[4] 赵一平,朱庆华,武春友. 面向EPR的政府及生产企业行为策略选择研究[J]. 管理学报,2007(6):737-742.
[5] 付小勇,朱庆华,窦一杰. 中国版WEEE法规实施中政府和电子企业演化博弈分析[J]. 管理评论,2011(10):171-176.
[6] 郑云虹,田海峰. 基于EPR的政府与生产企业博弈及制度设计[J]. 运筹与管理,2012(6):217-224.
[7] 王兆华,尹建华. 我国家电企业电子废弃物回收行为影响因素及特征分析[J]. 管理世界,2008(4):175-176.
[8] 钟永光,钱颖,尹凤福,周晓东. 激励居民参与环保化回收废弃家电及电子产品的系统动力学模型[J].系统工程理论与实践,2010(4):709-722.
[9] Lindhqvist T. Extended producer responsibility in cleaner production: Policy principle to promote environmental improvements of product systems [D]. Lund University, 2000.
[10]Sander K, Tojo N, Vernon J. The Producer Responsibility Principle of the WEEE Directive[J]. 2007.
[11]Akenji L, Hotta Y, Bengtsson M, et al. EPR policies for electronics in developing Asia: an adapted phase-in approach[J]. Waste Management
关键词:延伸生产者责任制(EPR);串谋;演化博弈
中图分类号:F224.1;F270 文献编码:A DOI:10.3969/j.issn.1003-8256.2016.03.004
1 引言
现代社会大量的废弃工业产品因得不到合理的处理而造成了资源浪费和环境污染。环境负外部性问题绝不仅仅是少数经济活动偶然的副产物,其根源于市场、社会和政府力量所构架的经济决策活动之中[1]。为了应对日益严重的环境问题,1988年,瑞典环境经济学家托马斯(Thomas.Lindhquist)提出生产者延伸责任(Extended Producer Responsibility,简称“EPR”)的概念,被经合组织(OECD)和欧盟(EU)认为是最有希望解决废弃产品和其污染问题的手段之一[2]。EPR是一种基于“污染者付费”的环境保护策略,主张将生产者的责任延伸到产品消费后的回收、处理和最终处置阶段,以达到产品生命周期环境绩效最优的结果[3]。
2008年我国全国人大颁布《循环经济促进法》确立在我国实施生产者延伸责任制度,在此前后,众多学者结合国情探讨了实施EPR制度的相关问题。例如,赵一平、付小勇、郑云虹等从不同角度构建了完全信息情境下,政府和核心企业的静态和和动态演化博弈模型,描述了政府与核心企业的互动关系,以及政府应采取的激励机制[4-6];王兆华、尹建华等指出回收制度及法规对企业回收废弃电器电子产品行为有显著影响[7];钟永光等从整合非正式回收者的角度得出,政府对非法拆解征收环保费用或者提高有资质回收企业的回收价格,可以激励回收小商贩参与环保拆解[8]。
国外学者对EPR的研究成果更为丰富,2000年,托马斯的题为《清洁生产中的延伸生产者责任》的博士论文,阐述了EPR的背景、内涵、目标、实施方式、以及各国的实践经验。[9]随后出现了大量关于EPR议题的研究,经合组织(OECD)在2001、2004和2005年分别出版了《EPR:政府工作指引》、《EPR 经济分析》以及《EPR项目的成本收益评估分析框架》,通过对各国EPR的实施情况进行评价,总结了EPR实施项目中存在的问题以及实践启示。托马斯的原创理论研究以及OECD的后续实践工作,成为各国学者继续开展EPR研究的基础。Sander和Tojo等总结了欧盟电子废弃物(WEEE)实施情况,[10]Akenjin和Manomaivibool以及Dwivedy等探讨了泰国、印度和其它一些亚洲国家的EPR实施情况[11-13],其中学者们共同关注了生产企业在实施EPR制度中的“搭便车”(Free Rider)问题。“搭便车”是指生产企业逃避履行延伸责任从而不付出相应成本的行为,德国“Dual System”回收系统曾因生产企业的“搭便车”损失惨重,[3]缅甸也将其视为影响EPR实施效果的重要因素。
目前,我国已在废弃电子产品、汽车、包装物等领域推行生产者延伸责任制,但针对我国国情,如何管理应对EPR制度下生产商与审查人的串通问题,探讨尚不充分。因此,本文运用演化博弈论分析工具,构建生产者、审查人和政府的三方博弈模型,通过分析博弈均衡条件,提出针对性的对策建议。
2 演化博弈模型的构建
2.1 模型的基本假设与收益矩阵
EPR制度将生产者责任延伸到产品消费后阶段,审查人对生产企业的EPR义务履行情况进行核查,并对政府主管部门上报企业EPR的实施情况,企业若不能通过审查就需要缴纳废弃产品处理基金,其生产成本将被迫提高。因此,为规避履行EPR义务带来的成本,某些生产企业可能与审查人员发生串谋活动。为避免这种情况,政府主管部门可能需要花费额外的人财物力对企业和审查人的活动加以监督,由此形成了生产企业、审查人和政府主管部门的三方博弈。该三方博弈模型建构的基本假设是(各参数含义如表1所示):
(i)生产企业串谋成本需小于因被审查发现而被迫履行EPR所增加的成本,即,否则其无串谋动机;
(ii)政府主管部门若监管良好,则一定能够发现生产企业和审查人的串谋行为。
政府主管部门选择监管策略时,若生产企业和审查人发生串谋行为,则勒令违规生产企业履行EPR义务并予以罚款,另外针对企业和审查人的串谋行为分别进行处罚;若生产企业和审查人不发生串谋行为,则政府主管部门浪费审查成本,但获得生产企业不履行EPR义务的罚没收入。
政府主管部门选择不监督策略时,若生产企业和审查人发生串谋行为,“搭便车”发生,政府主管部门将被迫承担废弃产品的回收处理成本;若生产企业和审查人不发生串谋行为,审查人按企业实际情况上报,未履行EPR义务的生产企业将被迫履行义务并支付罚款,政府主管部门获得生产企业不履行EPR义务的罚没收入。
博弈三方的收益矩阵如表2所示。
2.2 模型的建立
现实中,生产企业、审查人和政府主管部门均不能保证准确判断对方的策略选择,更为普遍的是各自采取混合策略,即各方均以某种概率分布来确定自己的行动方案,从而达到一种混合策略均衡。在均衡条件下,任何一方单独改变自己的策略都不可能给自己带来额外收益。我们用演化博弈求解均衡点,假设生产企业与审查人群体选择串谋的比例为x,则不串谋的比例为1-x;政府主管部门选择监督的比例为y,则选择不监督的比例为1-y。根据三方博弈收益矩阵可知:
生产企业选择与审查人串谋的期望收益:
生产企业选择不与审查人串谋的期望收益: 生产企业群体混合策略1的平均收益:
政府主管部门选择监管的期望收益:
政府主管部门选择不监管的期望收益:
政府主管部门群体混合策略的平均收益:
3 演化博弈均衡分析
3.1 生产企业与审查人群体“串谋”比例的复制动态方程
生产企业与审查人群体“串谋”比例的复制动态方程为:
当时,,取任何值,博弈均为稳定状态。
当时,令,是两个稳定点。
对求导,。
进化稳定策略(ESS)要求。
当时,,所以,因此是稳定点,生产企业会趋向于选择不与审查人串谋;
当时,,
所以,因此是稳定点,生产企业会趋向于选择与审查人串谋。
生产企业与审查人群体在Y三种不同取值情况下的策略选择的动态趋势及其稳定性如图1所示。
3.2 政府主管部门群体“监管”比例的复制动态方程
当时,,取任何值博弈均为稳定状态。
当时,令,是两个稳定点。
对求导,。
进化稳定策略(ESS)要求。
当时,,
所以,因此是稳定点,政府主管部门会趋向选择监督;
当时,,
所以,因此是稳定点,政府主管部门会趋向选择不监督。
政府主管部门群体在X三种不同取值情况下的动态趋势及其稳定性如图2所示。
3.3 三方演化博弈稳定分析
3.3.1 三方演化博弈均衡解
将三方群体复制动态趋势置于坐标平面上表示,如图3所示。分析得出4种均衡状态:
(1)当初始状态落在A区域时,该博弈收敛于平衡点,即:(串谋,不监督)是企业、审查人和政府主管部门三个博弈群体中所有参与者的必然选择;
(2)当初始状态落在B区域时,该博弈收敛于平衡点,即:(串谋,监督)是企业、审查人和政府主管部门三个博弈群体中所有参与者的必然选择;
(3)当初始状态落在C区域时,该博弈收敛于平衡点,即:(不串谋,监督)是企业、审查人和政府主管部门三个博弈群体中所有参与者的必然选择;
(4)当初始状态落在D区域时,该博弈收敛于平衡点,即:(不串谋,不监督)是企业、审查人和政府主管部门三个个博弈群体中所有参与者的必然选择;
根据Friedman[15]提出的方法,一个微分方程系统描述的群体动态,其均衡点的稳定性可由系统的雅可比(Jacobi)矩阵的局部稳定性分析得到:若矩阵的行列式值为正且迹为负,则局部均衡点为演化稳定策略(ESS);若矩阵的行列式和迹的值都为正,则为不稳定点;若矩阵的行列式为正且迹为0,则为鞍点。博弈的雅克比矩阵如下:
对4个均衡点进行稳定性分析如表3:
3.3.2 参数分析
(1)根据基本假设(ii),可知,,值不确定,(0,0)为鞍点。
(2)任何情况下,(0,1)点均为不稳定点。
(3)当且时,
如果,即,
那么(1,0)点为稳定点,企业与审查人串谋,政府主管部门不监管;
如果,那么(1,0)点为鞍点;
如果,那么(1,0)点为不稳定点。
(4)当时,恒成立,那么(1,1)恒为不稳定点。
4 结论与建议
本文研究得出以下几点结论:
第一,通过参数分析(3)发现,如果政府主管部门的监督成本过大,超过所有罚金及生产企业实施EPR成本之和的最大值,政府主管部门会采取不监督策略,那么生产企业和审查人会去选择串谋,也就是说,政府主管部门应将监管成本控制在的范围内,否则将不利于对串谋活动的规避。为了改善这种状况,政府主管部门需要努力降低监管成本,改良现有监管机制或引入先进管理办法;但如果串谋行为发生数量较大,则可以考虑提高相关惩处金额等办法加大惩罚力度,予以解决。
第二,根据假设(ii)可知,若,即生产企业与审查人的串谋成本过高时,串谋活动便不会发生,因此可知,可以通过改良审查机制等手段,为生产企业与审查人的串谋活动制造障碍,从而更为有利的避免此类“搭便车”现象的发生。
第三,演化博弈各群体对各自策略的初始选择比例对最终结果产生相异的均衡结果,因此政府主管部门应加强EPR的宣传教育,使生产企业和审查人充分理解实施EPR对于社会和环境的重要意义,从可持续发展角度思考自己的行为,并以此衡量自身的长期利益。
第四,对所有生产企业而言,若,也就是说企业能从实施EPR中获益,“搭便车”即可完全杜绝。因此,政府主管部门可以通过激励措施,积极引导企业发展“循环利用技术”,高效利用废弃产品,提高EPR的实施效果。
注释:
1 在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略(pure strategy)。如果在每个给定信息下只以某种概率选择不同策略,称为混合策略.
参考文献:
[1] 赵一平,朱庆华,傅泽强. 产品导向环境管理制度的发展与思考[J]. 科技进步与对策,2008(8):122-125.
[2] Nnorom I C,Osibanjo O. Overview of electronic waste (e-waste) management practices and legislations, and their poor applications in the developing countries[J]. Resources, conservation and recycling, 2008,52(6): 843-858. [3] Lifset R, Atasu A, Tojo N. Extended Producer Responsibility [J]. Journal of Industrial Ecology,2013,17(2): 162-166.
[4] 赵一平,朱庆华,武春友. 面向EPR的政府及生产企业行为策略选择研究[J]. 管理学报,2007(6):737-742.
[5] 付小勇,朱庆华,窦一杰. 中国版WEEE法规实施中政府和电子企业演化博弈分析[J]. 管理评论,2011(10):171-176.
[6] 郑云虹,田海峰. 基于EPR的政府与生产企业博弈及制度设计[J]. 运筹与管理,2012(6):217-224.
[7] 王兆华,尹建华. 我国家电企业电子废弃物回收行为影响因素及特征分析[J]. 管理世界,2008(4):175-176.
[8] 钟永光,钱颖,尹凤福,周晓东. 激励居民参与环保化回收废弃家电及电子产品的系统动力学模型[J].系统工程理论与实践,2010(4):709-722.
[9] Lindhqvist T. Extended producer responsibility in cleaner production: Policy principle to promote environmental improvements of product systems [D]. Lund University, 2000.
[10]Sander K, Tojo N, Vernon J. The Producer Responsibility Principle of the WEEE Directive[J]. 2007.
[11]Akenji L, Hotta Y, Bengtsson M, et al. EPR policies for electronics in developing Asia: an adapted phase-in approach[J]. Waste Management