不完整多视图聚类研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ccjhvv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实际数据通常来自多个不完整的数据源,不完整的多视图聚类方法提供了一些自然的方法来聚类这些不完整的数据。先前的研究假设所有视图都丢失相同比例的样本,并且不含有噪声。但是,在大多数实际应用中,不完整视图通常具有不同的缺失率(即不平衡不完整视图)和噪声,即包括强视图(缺失率低的视图)和弱视图(缺失率高的视图)。这些不平衡的缺失会导致先前的不完整多视图聚类算法失效,而且噪声导致不可靠的聚类结果。我提出了两种不完整多视图聚类算法来分别解决上述问题:不平衡不完整多视图聚类Unbalanced Incomplete Multi-view Clustering(UIMC)、自加权包含噪声的不完整多视图聚类Auto-weighted Noisy and Incomplete Multi-view Clustering(ANIMC)。据我所知,UIMC是第一个基于视图进化规则来解决不平衡不完整问题的研究。通过设计一个加权的多视图子空间聚类框架,UIMC能够基于不同视图的缺失率对这些不完整视图进行加权。并且,UIMC能够最小化每个视图的聚类指示矩阵与共识矩阵之间的差异,使得我们能够获得更好的聚类效果。与现有方法相比,UIMC具有以下优点:1)提出了加权多视图子空间聚类,以减少不平衡不完整的负面影响;2)它设计了鲁棒且低秩的子空间表示形式,以减少噪声对鲁棒性的影响。在四个真实数据集上进行的不平衡不完整多视图聚类实验证明了UIMC在解决不平衡不完整多视图聚类问题中的有效性。为了减小噪声对聚类的影响,ANIMC算法可自动学习所有视图共享的公共潜在特征矩阵和每个视图的适当权重,并基于自适应进行协作更新半非负矩阵分解。此外,在LF-范数正则回归和L2,1-范数正则回归的帮助下,公共潜在特征矩阵和不同视图中的相同样本分别对齐,因此减小了缺失样本对聚类结果的影响。同样地,在四个真实数据集上进行了包含噪声的不完整多视图聚类实验,实验结果显示了ANIMC在解决包含噪声的不完整多视图聚类问题中的有效性。
其他文献
拟建和在建的很多特高压工程处于地震的高烈度地区,而特高压工程的核心电气设备——特高压变压器极容易被地震所损坏,因此研究特高压变压器地震响应成为电力工程抗震研究的主要方向之一。传统特高压变压器的抗震设计是假定地基为刚性,并没有考虑土-结构的相互作用,人为地将特高压变压器和地基分开为独立部分进行计算,这种计算方法是不符合特高压变压器在地震下的实际动力响应,因此研究考虑土-结构相互作用时特高压变压器地震
学位
学位
学位
学位
硅钢是一种应用广泛的Fe-Si系软磁材料,其中含硅3%的硅钢,主要被用在高频变压器、脉冲变压器、脉冲发电机、大功率磁放大器、磁存储、记忆元件以及磁屏蔽中。工作频率越高,损耗越高。为了降低材料的能量损耗、了解磁畴结构如何影响磁性性能,研究3%Si硅钢的动态磁化过程显得尤为重要。此外,硅钢在自发磁化后的基态问题还未被探究,而且对其在外场下磁畴结构和磁矩分布的研究严重滞后,无法为实际中的应用建立很强的理
随着科技的发展,互联网在世界中的作用越来越大,数据安全是互联网安全中最重要的部分。数据存放在数据库中,数据库的安全受到威胁就等同于数据安全受到威胁,一旦数据库发生数据泄漏那么带来的损失是难以估计的。研究显示,数据库用户内部攻击对数据库安全的威胁远大于外部攻击的威胁,对于来自数据库内部的合法用户异常行为的检测就显得尤为重要。在前人的工作成果基础上,提出了基于半监督学习的数据库用户异常行为检测方法。提
刀具作为机械加工中材料去除的直接参与者,随着加工的继续将会出现刀具的磨损或者破损现象。刀具的过度磨损或者破损直接影响加工零件的质量,增加制造成本。因此刀具状态的在线监测对提升加工质量、节省制造成本以及提高制造效率,同时对制造业走向智能化、无人化具有非常重要的意义。本文所做研究如下:首先,通过全因子实验获取不同加工条件、不同刀具磨损状态下的切削信号。对铣刀磨损、断裂监测信号的特征提取方法及特征选择方
作为农业“芯片”的种子是农业形成与发展的根基,稳固种业发展,关乎兴国安邦、千秋万代,党的十八大以来,特别是十九大之后,种业在现代农业产业体系中的战略地位越发凸显。以现代农业产业园为载体,强化种业发展,是当前我国突破种子领域“卡脖子”技术难题的有效路径。2017年以来,全国各地纷纷因地制宜依托当地主导产业创建现代农业产业园,逐步形成以“园”(国家级园区)带“园”(地方级园区)、梯次推进的现代产业园区
学位