线性模型中自变量相对重要性的Shapley值估计与有偏估计

被引量 : 0次 | 上传用户:tommy0229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究目的本研究共有两个目的:第一,研究线性回归模型因变量总变异(R2)在各个自变量中的分割问题(相对重要性估计)与对策理论中求解Shapley值的同构性以及自变量相对重要性估计的前提条件(期望准则),根据对策理论Shapley值对自变量所有组合中逐步引入自变量时模型的R2增加值的序列与平均值,从而建立基于Shapley值法的自变量相对性估计方法,并与几种现存方法进行比较。第二,考虑到当自变量间存在多重共线性时,用普通最小二乘法建立的回归模型可能不稳定甚至是失真的,那么估计自变量相对重要性也是多余的。因此,本研究分别用实际例子及大量模拟数据探索分析乘积尺度、相对权重在偏最小二乘回归模型中自变量相对重要性估计的应用。研究方法对于第一个研究目的,本研究采用Shapley在1953年提出的对策理论法求解Shapley值法对自变量相对重要性进行估计。对第二个目的,本研究采用乘积尺度法和相对权重法的思路,模拟试验数据采用Monte Calro法进行模拟。所有的计算结果利用SAS9.2编程实现。研究结果用对策理论建立的自变量相对重要性分析方法在实际数据中估计的结果和优势分析一致,估计结果结果均优于传统的估计方法。在用实际案例探索分析偏最小二乘回归中自变量相对重要性发现,优势分析和Shapley值估计法不适合用于有偏估计中,采用相对权重利用自变量正交转化的思路求解的自变量相对重要性结果也不符合自变量重要性求解的前提条件,故探索乘积尺度在偏最小二乘回归中自变量相对重要性的应用。大量的模拟数据结果发现,虽然乘积尺度估计的自变量相对重要性值之和能够较好地贴近模型总变异R2,但是估计的结果仍然存在负值,且出现负值的情况随自变量的个数增多也在急剧增加。研究结论对策理论的Shapley值法可以作为估计自变量相对重要性的方法,相比于其他方法,Shapley值不是一个探索式的理论方法而是基于四个公理推导且已经作为一个公理使用的方法。另外,Shapley值法对更加复杂的问题提供了一个比较接近实际的模型,原因是它比较和平均了自变量所有可能的子集构成模型的总变异R2。在自变量间存在较高相关性时,首先用偏最小二乘法对回归模型进行修正,再用乘积尺度法估计自变量相对重要性时,估计的结果值仍会出现负值的情况,说明这种方法的使用仍存在缺陷。
其他文献
在众多花草文学意象中,扬州琼花作为一个被集中书写的对象肇始于宋代。配合着历史的变迁,琼花经由宋代文人持续的诠释与书写,文化内涵渐次增加,文学意象日益饱满。尽管琼花物
<正>他从事艺术品工作几十年,慧眼识珠却从不"捡漏"。他的理由很特别——自己的定位,并不适合做腰缠万贯的富翁;他在业内名震八方,却从不会奚落不懂门道的收藏者,只要有时间,
该文介绍了小米整体的人力资源管理体系,从员工招聘到薪酬管理等等重要环节,然后主要通过分析小米的几个成功的人力资源特点,包括在员工招聘、绩效考核、利益分享等等方面,最
随着当代中国对传统文化的价值重估和理论重建,《尚书》学文献整理已经不是传统意义上的文献整理,而是一次大规模有组织的为国故修理序、为经典作新解的学术活动,是实现民族
论及我国传媒在小康社会建设中所发挥的功用,可以从物质文明、精神文明和政治文明等三个层面上去分析。尽管发展传播学对传媒在社会发展中的积极作用给予了高度评价,但通过本
党的十八大报告提出经济体制改革的核心问题是处理好政府和市场的关系,必须更加尊重市场规律,更好发挥政府作用。科学领会其精神实质,对于统一人们的认识,有序推进改革,具有
近年来,税务风险已成为企业面临的重大风险之一。企业如何正确处理面临的税务风险,对企业的发展有着重大的意义。税务风险管理不当,会给企业带来严重的损失。房地产行业涉税环节
锂离子电池以其优越的性能被广泛应用于各个领域,但其自身仍存在安全性和可靠性问题,故应用中需对锂离子电池的工作状态进行在线监测和综合管理。近年来,作为锂离子电池管理、保
张爱玲的自传式小说《小团圆》再现作家挣扎于"痛苦之浴"、维护女性"人的尊严"的艰难历程,对胡兰成《今生今世》陈腐的性别观及封建婚姻观进行现代解构;在勇敢正视痛苦的生命
自从20世纪60年代美国引入教师职业阶梯计划以来,职级制度已发展成为美国中小学教师管理的重要制度,是一种普遍实施的教师激励计划。目前美国大部分州都已实施该制度,田纳西州的