论文部分内容阅读
随着精密数字设备、高精度传感器以及社交网络的普及,从这些领域获取的数据的维度也在不断增加。超高维的数据往往会增加算法的时间复杂度,增加使用的存储空间,并且降低算法的泛化性能,导致维度灾难。子空间学习是处理高维数据的一种有效方式。在实际情况中常常有多视角数据,而传统的子空间往往只能处理单个视角数据,无法有效利用多视角数据的一致性和互补性。本文的研究目标为单视角高维数据和多视角高维数据的子空间学习算法。实际应用中,很难得到数据的标记信息,因此无监督学习是当前的研究热点之一。本文提出单视角子空间学习算法和多视角子空间学习算法都是无监督学习算法。本文提出的基于解析字典学习的子空间学习中,我们利用解析字典将数据从原始数据空间投影到一个低维隐空间中,同时保持数据在原始空间中的流形结构,并提出了优化算法。通过在四个数据集上对算法进行实验验证,并选取了五个无监督子空间学习算法作为对比算法,实验结果表明算法的有效性。多视角数据通常具有比单视角数据更加丰富的信息,但由于单视角数据只能利用一个视角的数据,对于多视角数据来说如果无法很好利用这些信息,学习效果不仅不会提升甚至可能会降低,因而对多视角高维数据也是很有意义的。本文提出的基于多视角隐空间的子空间学习算法,考虑多个视角之间的一致性我们将不同视角统一到同一个隐空间上,而对于多视角之间的互补性,我们对隐空间学习引入流形正则,并且自适应的学习每个视角的权重值。我们同时将学习到的隐空间看做多视角聚类的聚类结果,从而将算法应用到多视角聚类中。最后我们在四个数据集上进行了实验验证,并分别选取了四个单视角、多视角子空间学习算法以及四个单视角、多视角聚类算法。本文研究无标签的高维数据,充分考虑高维数据和多视角高维数据的特点,提出了单视角和多视角两种基于隐空间的无监督子空间学习,经过实验验证取得了良好的结果。