基于自适应弹性网对强相关数据的群组变量选择的研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:liu033041
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变量选择作为数据分析的重要方法之一深受广大学者的青睐。近年来,高维、强相关又带有冗余的数据广泛应用在自然科学及生物医学学科等领域,怎么选用合适的变量选择方法解决该类问题已是当前研究中的关键。本文针对高维、强相关的数据进行研究,做了如下工作:1.提出了一种改进权值的自适应弹性网方法(G_Aenet),该方法以偏最小二乘回归系数的权重代替原始权重,使新方法能更好地选取群组中的重要变量和去除群组中的噪音变量。通过理论证明,说明了该方法具备自适应群组效应;并通过模拟实验和数值实例,比较Lasso惩罚及传统的自适应弹性网等变量选择方法,用相对误差RMSE和选择精度标准TP(FP)作为精度和模型复杂度的标准,验证了该方法的有效性,实现了提高模型精度,精简模型复杂度的目的。2.基于偏最小二乘回归及传统的自适应弹性网方法均可解决强相关数据问题,但又存在偏最小二乘的模型解释性差和传统的自适应弹性网方法的模型精度不高等缺点,故提出了一种改进的强相关数据的变量选择方法(Aenet_PLS)。该方法将偏最小二乘方法与传统自适应弹性网方法求得的估计系数做线性组合,并以此得到的系数建立回归模型,使新模型具备高精度、解释性强的双重优点。
其他文献
目的:观察δ阿片受体激活剂D-丙(2)-D-亮(5)脑啡肽(DADLE)对培养心肌细胞缺氧/复氧(H/R)损伤的保护作用。方法:采用培养的SD大鼠乳鼠的心肌细胞,建立H/R损伤模型,检测指标包括:(1)心肌细胞形态;(2
<正>目的多项国内外临床研究显示心脑血管事件容易发生在清晨,并猜测可能与清晨血压增高(即血压晨峰现象,Morning Blood Pressure Surge,MS)相关。然而,血压晨峰对心脑血管事
会议
热岛效应的产生与温室气体、大气污染、人类活动和地表结构密切相关。随着城市化进程的推进、城市人口的迅速增加和城市建设用地的快速扩大,导致了一系列生态环境问题,城市下
随着医院质量的提高,产妇分娩时无痛提出了迫切的要求.为了满足产妇无痛分娩的要求,曲阜市鼓楼医院麻醉科由麻醉医生、产科医生、助产护士共同组成无痛分娩工作小组,于2000年
多模式镇痛(multimodal analgesia)联合使用作用机制不同的镇痛药物或镇痛方法,由于每种药物的剂量减小,副作用相应降低,镇痛作用相加或协同,从而达到最大的效应/副作用比。