超高维数据情形下可加模型的变量筛选

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:gbqangel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展和计算机计算能力的不断提高相辅相成,现如今超高维数据出现在我们多个研究领域中。在自然科学,人类基因等研究问题中,巨大的数据量以及其相应增加的计算难度都为研究者们带来了困难。在超高维数据情况下只有少数的协变量与响应变量具有相关性。超高维数据分析的基础是从数据中找出重要的变量,从而能对超高维数据进行建模。经过多年研究,现在多用的策略是建立一个两阶段特征选择过程,第一阶段使用计算效率较高的变量筛选方法在能够保留所有的重要特征的前提下将特征维度数量降低到样本量之下的合适规模,第二阶段再采用一些有效的方法对降维后的数据进行重要变量筛选。本文主要研究的内容是在超高维数据情形下的可加模型的变量筛选方法。提出基于鞅差相关系数的可加模型的变量筛选法,将变量维度减少到低于样本量的合适数量,实现超高维数据情况下变量选择的第一阶段。在一定的条件下,我们证明了方法的筛选一致性。通过模拟数据实验和真实数据分析的结果表明本文所提出方法有着良好的筛选效果。
其他文献
当前我国城市空间增长逐步转型,突出表现为从简单追求城市建设用地数量的增加转向追求城市建设用地高质量高效率发展。城市空间增长边界作为控制城市低效蔓延的手段之一,以生
我国西北部边远的藏区、牧区环境恶劣,建筑材料严重匮乏,在这些地区进行土木工程建设必须考虑交通和成本问题,因此就近取材显得尤为重要。在当地,牛粪晒干后作为重要的资源供居民当做燃料使用,产生了大量的废弃物——牛粪灰。牛粪灰(CMA)质纯且成分相对稳定。将废弃的CMA替代部分水泥用于混凝土,不仅改善了建筑材料短缺的问题,也解决了由于CMA处理不当带来的环境问题。系统研究CMA混凝土的力学性能是为CMA的
莲藕(Nelumbo nucifera Gaertn.)又名藕,是睡莲科(Nymphaeaceae)莲属多年生水生草本植物,在我国水生蔬菜种植面积中占首位,也是我国重要的出口蔬菜之一。莲藕具有丰富的营养价值和经济价值,肥大的地下茎是主要食用部位。莲藕的根系主要有两种,主根和不定根,但主根不发达,所以在莲藕的生长过程中,不定根的形成发育起关键作用。糖不仅为植物的根系生长提供营养,也充当着信号分子的作
学位
随着城市化进程的不断发展,众多现代城市公共空间在设计初期缺乏对历史和地域文化的考量,导致现代城市公共空间在内容与形式的体现上过于单调,无差别的空间环境逐渐削弱了人们的归属感和安全感。现代城市公共空间在城市中的占比较大,具有展现城市风貌、彰显城市内涵、承载城市文化的重要作用,如何在发展过程中保持地域特色,找到适合自己的发展道路,成为当今设计者和学者亟待解决的问题。对此问题的出现,首先从地域文化和现代
胭脂红是一种颜色鲜艳,染色力强,价格便宜的食品加工业广泛使用的偶氮类染料。研究发现长期大量摄入胭脂红对人体健康有害。因此,开发一个能够以高灵敏度和高选择性对胭脂红
盐岩具有良好的蠕变性能、低孔隙率以及损伤自我恢复等优点,被公认为是能源储存的理想介质。我国的盐岩矿床主要呈层状结构分布,在变形和力学性能方面不同于国外均质巨厚的盐
随着燃料电池技术的发展,生产出一种能够用于燃料电池的超低硫柴油(S含量
伴随着人类历史的发展和科学技术的进步,射电望远镜观测技术的进步强有力地促进了天文学的发展,并成为其发展的主要动力之一。望远镜结构的反射表面积是射电望远镜性能的重要指标之一,口径尺寸更大的射电望远镜可以观测到更多和更远的天体。世界上目前已建成的最大口径全可动射电望远镜是美国2000年建成的绿岸射电望远镜(GBT,口径100×110m),现阶段我国最大口径的全可动射电望远镜是上海天文台建造的65米口径
维珍航空是继英国航空公司之后的第二大国际航空公司,传奇性的创始人理查德布兰森引领了该航空公司风趣、幽默且勇于创新的企业文化。公司的经营目标是为所有乘客提供高品质