融合稀疏表示的特征降维算法研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:kyy06
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,各个领域积累了大量的高维数据,这对存储和计算方面都是极大的挑战.解决这一问题的有效方法是特征降维.由于人工标注的困难和高成本,在实际应用中,有标签样本较少,无标签样本较多.因此,非监督特征选择和半监督特征选择成为了机器学习领域的热门研究方向.特征降维可以通过特征提取或特征选择实现,目前将特征选择和子空间学习相结合的特征选择方法逐渐成为该方向的研究热点,其特点是通过保持数据的结构信息得到变换矩阵,再根据变换矩阵的行或列向量的范数引导特征选择.数据的流形结构保持可选择出有类别判别能力的特征.常用的结构保持方法有局部线性嵌入(LLE)和稀疏保持投影(SPP)等,由于能保持数据的流形结构而被广泛应用.但是这些基于结构保持的特征选择方法研究中仍然存在一些问题,比如参数难以确定、对于噪声的鲁棒性不强及不能获得丰富的判别信息等.本文以改进这些问题为出发点,围绕基于结构保持的特征选择方法进行深入研究,提出了相应的解决算法,并在一些标准数据集上对所提算法进行对比验证.本文的主要工作和创新点如下:1.针对低秩稀疏保持投影(LRSPP)模型缺乏原始数据空间和所选特征张成的子空间之间的信息差异度量,从而导致降维过程中可能的信息损失,同时缺乏投影矩阵的稀疏正则项导致不能选择出稀疏的特征的几个问题.本文提出全局和内部几何结构嵌入的非监督特征选择(GGEFS)算法.该降维模型综合考虑了降维前后的信息差异度量、结构保持和投影矩阵的稀疏正则项.其中信息差异度量可减少降维过程中的信息损失.结构保持将事先学习到的样本低秩稀疏表示嵌入在降维过程中,保持了数据的全局和内部几何结构信息.投影矩阵的稀疏正则项使用l2,12混合分数范数,能选择出更稀疏和更有判别性的特征.2.针对半监督特征选择方法,本文提出了低秩稀疏图嵌入的半监督特征选择(SFS-LRSE)方法.在结构学习的过程中充分利用已有数据,对有标签数据与无标签数据分开学习其低秩稀疏表示,有标签数据按不同类别分开学习,将得到的总体低秩稀疏图嵌入在降维过程中,从而将数据的结构信息充分地保持在低维空间中.
其他文献
配电网设备作为电力系统的重要组成部分,它是否能够正常并稳定运行,关系到配网供电的安全性和可靠性。因此,电力企业相关工作人员需要对配电网设备进行定期维护和修理,及时掌
基于逐5 min地面气象要素观测数据、逐日气象观冰站电线覆冰观测数据、安庆站逐12 h探空观测资料以及逐6 h ERA-Interim再分析资料,对2018年初安徽省沿长江及跨江线路电线舞
大数据时代的到来,使会计信息化发展到一个新的阶段,为企业提供了资源共享平台,全面提升了企业财务的工作效率。但大数据与云计算的深度融合,各种数据共享平台的建设,也使会
"治下的和平"是和平的表现形式之一,其本质上就是霸权和平,历史曾经出现的多种"治下和平"的说法,但是最后都毫无例外地衰落或终结,当今维持国际体系将不是一国而是多国,国际社会
近年来,我国东部区域大气污染备受关注,准确监测获取气溶胶光学特性时空分布,对研究区域大气污染形成机理与治理至关重要。本研究利用CSHNET和CARE-China地基观测网数据分析
背景:乳腺癌是女性常见的恶性肿瘤,其发病率正逐年攀升。在女性乳腺组织中,内皮细胞及其他细胞约只占总数的10%,剩下的90%为脂肪细胞,可见脂肪细胞及其分泌的细胞因子对乳腺
人脸美丽预测利用智能信息处理技术提取人脸面部的美学特征,将主观的美丽感知转换成机器学习的模式识别问题,从而实现对人脸美丽度进行智能预测。由于人们对人脸美丽存在主观
本文针对振动的颗粒物质出现的聚集,扩散和相变现象,使用urn模型对其动力学行为进行讨论与研究。 首先讨论了颗粒物质在几种多urn模型中,按照动力学规则运动的分布情况。系统
梅与竹、松誉为“岁寒三友”,梅、兰、竹、菊并称为“四君子”。介绍了梅花相关栽培和繁殖技术.为相关人员提供参考,期望能藉此带来相应价值。
在卒中的实验性研究中,发现胆红素能抑制动脉粥样硬化,与颈动脉斑块的形成呈负相关,并具有神经保护作用。目前,尚无胆红素水平与卒中相关的临床数据。美国哈佛医学院布莱根妇