【摘 要】
:
当今信息时代,数据已经渗透到每一个行业和职能领域,逐渐成为重要的生产因素。如何从冗杂的数据中提取重要特征,如何处理高维复杂数据结构,已成为统计学研究的热点问题。其中
论文部分内容阅读
当今信息时代,数据已经渗透到每一个行业和职能领域,逐渐成为重要的生产因素。如何从冗杂的数据中提取重要特征,如何处理高维复杂数据结构,已成为统计学研究的热点问题。其中,变量选择就是一种提取有效信息的重要方法。自1996年统计学家Tibshirani提出Lasso方法以来,极大地推动了变量选择方法的研究,常见的方法有:Lasso、岭回归、Elastic-Net、SCAD、MCP等。这些方法通过惩罚函数的形式在最小二乘的基础上施加惩罚,以达到压缩变量的效果。本文旨在通过数值模拟和实证分析,全面、综合地比较这五种方法的应用效果。对比数值模拟和实证分析的结果,可以发现,带惩罚的Logistic变量选择模型预测准确率均高于全变量Logistic模型;Lasso和SCAD方法适用性较强,在不同数据量和变量间相关程度下,都能保证较高的预测精度和较小的系数估计误差;岭回归和Elastic-Net倾向于保留较多变量,虽然预测准确率较高但系数估计误差较大;MCP方法适用于自变量相关性较强的情况,对变量的压缩程度较大。结合沪深A股制造业上市公司财务数据进行实证研究,结果表明SCAD和Lasso惩罚逻辑回归具有较好的预测效果和经济解释能力,能够识别企业盈利能力、成长能力、经营能力以及资本结构中重要因素对财务困境的影响,具有较好的实用性。
其他文献
慢性阻塞性肺疾病(COPD)是以气道阻塞为特征的慢性支气管炎或(和)肺气肿。是呼吸系统最常见的疾病之一。吸烟、有害气体刺激、肺部感染以及机体防御系统失调等致病因素的作用
在毛主席革命路线指引下,我们坚持以阶级斗争为纲,抓革命,促生产,认真贯彻农业“八字宪法”,春小麦丰产实验有了发展,产量逐年上升。1975年丰产田45.02亩,平均亩产604.3斤,
从人因工学角度和工业设计理念来讲,产品设计应该充分体现人、机、环境三要素之间的相互关系,从而确保人—机—环境系统总体性能的最优化,根据不同使用群体定位,为消费者设计
天然气管道泄露是现代社会发展的主要危险形式,天然气管道泄露产生的巨大的震动波容易发生爆炸.基于天然气管道泄露的爆炸动力为基础,对天然气管道泄露爆炸动力效应及危险区
【正】 《国外语言学中的翻译理论问题》(Воп-росы теории перевода в зарубежной линг-вистике)是一部论文集,由苏联语文学博
目的观察纤维支气管镜(纤支镜)介入联合药物雾化吸入治疗支气管内膜结核(EBTB)的疗效。方法对20例确诊EBTB病人在全身抗结核基础上行纤支镜介入局部注药和药物雾化吸入治疗。
【正】数学思想是数学的灵魂.2011年版《数学课程标准》指出:要结合学习数学的教学内容,有目的、有计划渗透数学思想方法.这样,既能使学生更好地理解和掌握教学内容,更能使学
论文通过文献查询以及调研等方法分析了我国海洋渔业资源环境调查情况,以及我国海洋渔业资源环境科学调查船发展现状,并提出了尽快制定国家海洋渔业资源环境科学调查船建设规划
2015年是中国人民抗日战争暨世界反法西斯战争胜利70周年。作为贵州省规模最大的国家综合档案馆,贵州省档案馆以此为契机,进一步担负起“充分发挥档案资源独特优势,倾力打造党史
目的:了解青岛地区阿片类镇痛药用量及销售金额构成情况。方法:调查该地区29家二级以上公立医院阿片类镇痛药的消耗数据,采用ABC分析法及限定日剂量法进行统计分析。结果:ABC分