基于非负矩阵分解的维度约简模型研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:tienan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,海量的高维数据更加频繁的进入我们的日常生活中。社会信息化程度提高为我们带来便利的同时,也使传统的数据挖掘方法面临冲击。在处理高维数据时,传统数据分析方法往往会遭遇“维数灾难”,解决该问题的有效途径是先对原始数据进行维度约简,再对约简后的数据进行分析。维度约简可以有效地在保留关键信息的同时降低原始数据空间的维度,然而,伴随着技术的发展,采集到的数据从规模和复杂程度上都已经将要超出传统方法所能处理的范畴,经典算法的性能难以发挥,表现不尽人意。基于非负矩阵分解的方法由于其特性,一直以来受到广泛关注和欢迎。因此,本文研究基于非负矩阵分解的维度约简模型,分析传统算法存在的问题并探索解决方案。本文主要的工作和成果如下:(1)首先,在对现有工作进行充分调研和总结的基础上,统合已有算法的优势,提出一种基于流形学习和l1/2稀疏约束的非负矩阵分解方法,将其用于维度约简工作。针对大数据时代来源数据维度高、结构复杂、可能存在大量冗余的特点,通过引入去噪处理、显式附加l1/2稀疏范数进行约束和添加基于流形学习思想的图正则化的方法分别予以解决,从而更加有效地对原始数据进行特征提取,克服了经典算法在处理该类型数据时的不足。(2)其次,在前一方法的基础上,进一步提出一种基于二部聚类思想的非负矩阵三分解方法。该方法针对传统二分解过程中存在的,原始数据矩阵行和列之间蕴含的潜在联系可能被忽略的不足,将算法进行进一步的延伸,避免了单独从一个维度展开分析可能造成来自另一维度关键信息的丢失,进而影响算法准确率的问题。该算法有效提升了对具有特定结构的原始数据进行维度约简的效果。(3)为了验证方法的有效性,我们考虑算法在实际研究中的应用。考虑到基因分析领域的实际研究需求和其数据的典型特征,选择来自真实采样的基因表达谱数据集进行仿真实验,并将结果与经典方法进行对比。实验结果验证了算法的有效性和在结果上的显著优势。
其他文献
随着科技进步和经济发展,信用卡的用卡场景不断丰富,信用卡业务早已成为商业银行创造中收的重点业务。信用卡业务虽然可以创造较高收益,但随之而来的就是较高的风险,且风险贯穿信用卡业务的发卡、支付、应用等整个流程,只要出现风险,就必然会由发卡银行、收单机构、持卡人、特约商户等诸多主体中的一方承担损失,影响到其经济利益。I银行是一家大型商业银行,L分行属其二级分行,该银行的信用卡业务起步较早,发展迅速,业务
亚快速凝固工艺不受工艺设备与产品尺寸的限制,易于产业化,且拥有快速凝固的众多优点,具有良好的应用前景。TiAl合金属于典型的包晶系统,凝固过程中冷却速度的变化会使其凝固组织呈现多种形态。采用亚快速凝固技术,可以最大限度发挥合金材料性能潜力。本文通过铸造不同厚度TiAl合金板材的方式来获得不同冷却速度的TiAl合金试样,以此来研究在亚快速凝固条件下,冷却速度对Ti-Al二元合金凝固组织、包晶点与Cβ
随着我国工业建设现代化的深入发展,各行业对机械加工制造水平的要求日益提高,数控加工技术得到高速发展。其中,高精度数控加工技术代表了整个国家制造业的现代化程度和水平,
随着网络和多媒体技术的飞速发展,图像检索已经被广泛应有于搜索引擎,医疗诊断,电子商务,版权保护等领域中。得益于云计算和云存储技术日益普及,人们开始将本地图像和图像检
近年来,脑卒中已成为我国致死、致残的第一大原因。随着对脑卒中疾病关注的增加,研究发现卒中后认知功能障碍(post-stroke cognitive impairment,PSCI)是急性缺血性脑卒中(acute ischemic stroke,AIS)发生后致残的主要原因之一,严重影响到脑卒中人群的生活质量。然而,PSCI的诊断往往需要在卒中3个月后或者更长的时间通过各类量表来进行评估。此外,目前
重型数控机床是衡量一个国家综合国力和技术水平的重要战略物资,随着现代机械制造技术的不断发展,人们对重型数控机床加工精度的要求越来越高。重型数控机床具有垂直高度高、
生活中常见的拉索,由于其结构合理,造型美观,广泛应用于斜拉桥、桅杆结构、拉索屋面等结构中,与其他受力结构相比,其刚度较小,质量较轻且阻尼较小。然而其在外界荷载作用下极
随着社会的进步与发展,能源需求量也在逐渐上升,传统的化石能源已经不能满足我们的需求标准,即要保护环境又要储量丰富,所以新能源的开发利用是未来社会的主要战略目标之一。各种新型能源层出不穷,当下真正满足我们需求的也只有风能和太阳能,它们储量丰富,清洁无污染,符合我们的基本标准。从我国国土面积及地理面貌考虑,很适合我们开发利用。风能和太阳能储量丰富,但是风光的特性很明显,均受地域与天气变化影响,存在间歇
表活剂变粘酸对缓蚀剂类型有严格的要求,不同结构的表活剂需要不同类型的缓蚀剂。本文通过分析缓蚀机理,测试不同缓蚀剂在表活剂变粘酸中的缓蚀性能和及其残酸的粘度,分析讨
历史教育对提高学生的人文素养有着重要的作用。众所周知,学生才是学习的主人,为了帮助学生更好地学习历史知识,教师应在教学环节关注学习动机的培养,并将之作为新课程改革的突破口。美国教育心理学家凯勒提出的ARCS动机设计模式由注意、切身性、自信、满意四个基本要素构成,是目前将学习动机理论融入教学设计环节最系统的学说。近年来,随着国内教育学家对ARCS动机设计模式的引入和发展,将该模式应用于各个学段、学科