logistic回归模型中自变量相对重要性的评价方法

被引量 : 0次 | 上传用户:shijunfengmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的系统引进logistic回归模型中自变量相对重要性的评价方法,开发SAS程序对目前推荐的两种方法(优势分析和相对权重)进行估计并应用于实际例子,合理估计并帮助解释自变量的相对重要性。同时引进和提出一种可视化工具——秩优势比图,快速、直观地评价自变量的相对重要性。方法1、在分析传统方法缺陷的基础上,比较系统地介绍优势分析和相对权重两种估计方法,分别应用具体实例分析,同时使用同一数据资料对这两种方法进行比较分析,并与传统方法相比较。2、介绍4种适用于logistic回归模型的R2类似统计指标,在同一模型中比较分析各个估计结果以获得更适合logistic模型的广义决定系数。3、通过logistic回归模型中优势比的秩比例变换,在同一图形中展示自变量的相对重要性关系。结果1、传统方法(如二元相关和标准回归系数)不能正确分解自变量间共享的贡献,各自变量的贡献权重总和超过模型的R2,且结果不稳定,无法准确估计共线性存在条件下的自变量相对重要性。2、在自变量间存在多重共线性条件下,优势分析和相对权重对自变量重要性的估计提供一个更合理可行的衡量方法,各自变量的重要性权重比例和均等于100%,且总能提供一个正向估计结果。资料3.1显示各自变量的优势权重分别为0.0975(19.88%)、0.1010(20.60%)、0.1835(37.32%)和0.1085(22.12%),其相对重要性排序与标准回归系数的排序不同,且结果表明在logistic回归模型中广义决定系数R2M和R2E更适合用于估计自变量对因变量的解释比例;比较同一子模型发现变量间存在完全优势关系和总体优势关系。资料3.2显示各指标的相对重要性排序均不同,相关和回归分析中某自变量的作用方向相反;各自变量的相对权重分别为0.012(1.8%)、0.022(3.3%)、0.077(11.5%)、0.085(12.6%)、0.036(5.3%)、0.117(17.5%)、0.088(13.1%)、0.229(34.1%)和0.005(0.8%)。资料3.3显示在同一资料中优势分析和相对权重的估计结果基本一致,两者之间差的平均绝对值为0.0025,各自变量的优势权重分别为0.0004、0.0024、0.0007和0.0001,相对权重分别为0.0003、0.0032、0.0007和0.0002,结果与标准回归平方的重要性排序相同,但标准回归平方的重要性比例之和超过100%,如完全标准回归平方等于112.8%,且优势分析和相对权重与标准回归平方的估计结果差异明显。3、秩优势比图可在同一图形中比较多个自变量的相对重要性,同时提供更详细的变量信息,虽然该方法和标准回归系数一样存在一定的限制性。资料4.2显示之前是否参加新农合对参合的意愿性影响最大;在之前参合的人群中,文化水平对参合意愿的影响相较于家庭人口数更重要,且高中及以上教育的人群更愿意参合,人口数小于三人的人群参合意愿性更强。结论1、当自变量间存在共线性时,优势分析和相对权重分析是评价自变量相对重要性的精确量化指标,不依赖于模型的具体结构,虽基于不同的数学理论基础,但产生的估计结果差异很小且均等于模型的可解释方差比例。优势分析能提供关于相对重要性的更多水平的优势权重,但随着自变量数目的增加,优势权重的计算变得繁重。而相对权重计算效率更高,在解释上更容易理解,两者可相互参考应用。2、秩优势比图在视觉上更清晰,可直观地反映自变量的相对重要性,虽有一定限制性,结合其他方法使用可回答现有方法中还不能完全解决的一些相关问题,有很多实际应用。
其他文献
数学具有高度的抽象性、严谨的逻辑性和广泛的应用性。中学阶段不可避免地出现了相当一部分学困生,严重影响了数学教学质量的提高。初中数学学困生的形成主要有以下几个方面
近几天,无论是各大媒体,还是微信微博等热门社交平台,都被“弯弯酒店遇袭”事件占据。此次女子在北京望京798如家和颐酒店遭陌生男子袭击,酒店无安保人员制止的事件在当事人微博
报纸
直接数字频率合成器简称为DDS,这是一种最近一些年才发展起来的新型的频率合成技术。这种技术依托于快速发展的集成电路技术,现代集成电路技术根据摩尔定律的预测在不断的进
聚合物波导作为集成光学的重要分支,以其成本低、体积小、制备工艺简单、优良的兼容性、较低的光吸收损耗等优点,相关研究受到国内外科研机构和研究工作者的极大关注。在光传
当前阶段,为了实现林业经济效益的提升,需要重视营林产业和林业资源的生产力水平,将林业的发展作为重点项目。由于我国正逐渐淘汰粗放造林转而应用集约化造林方式,"封、造、
文章以西拉木伦河中新开河台河口-大兴业河段为典型研究河段,借助SPSS软件数据分析功能,对次洪水的河道渗漏量与次洪水的洪量进行回归分析,得到不同量级的次洪水与渗漏量之间
随着时代的发展,现代教育技术已经进入了很多小学的课堂。比起以往的教学模式,有多媒体作为硬件支撑的小学课堂能够有着更多发展变化的机会。但是因为诸多客观因素,导致很多
目的观察和分析赛护迪医用冷敷贴预防性外敷在降低血管活性药物致静脉炎中的效果,为临床护士预防静脉炎提供参考。方法将2016年1月-2017年1月我科住院应用血管活性药物的患者
在上海中国航海博物馆历史馆的陈列长廊的一角,藏有一艘由纯金打造的“春秋时期吴国大翼战船”模型。该船气势恢宏,造型独特,用料贵重,可以说,是航海博物馆七百多艘船舶模型中最为
期刊
目的:探讨Ki67的表达与乳腺癌的临床病理因素、分期、分子分型及预后的关系和临床意义。方法:回顾性分析2001年1月至2011年5月福建省立医院收治的乳腺癌患者共692例。根据术后