论文部分内容阅读
近年来,随着信息科学的飞速发展,特别是与互联网、生物医学和社会化计算等新兴领域的结合,海量数据分析与处理成为目前信息科学领域亟待解决的重要问题,尤其是如何有效处理各种具有复杂几何结构的高维数据已成为目前国内外学者研究的热点和难点。本文针对高维数据处理问题,从几何分析角度出发,在典型数据处理模型的快速计算方法,无监督与监督学习理论以及图像处理应用等三方面展开研究,取得了一系列重要成果。本文工作主要包括:(1)提出求解主元追踪模型(PCP)的l1滤波方法。该方法将在整个数据矩阵上计算的PCP模型转化为种子矩阵恢复和可并行l1范数极小化两个子问题。我们的这种新方法在保证数据恢复精度的前提下,每步迭代的计算仅需要线性时间复杂度,大大降低了在大规模数据上求解PCP模型的难度。(2)通过改进传统的交替方向法(ADM),提出求解可分离变量凸优化模型的自适应罚项线性化交替方向法(LADMAP),并证明了该算法的全局收敛性。我们的新方法避免了传统算法需要引入新的辅助变量的缺点,节省了存储空间并且避免了计算引入辅助变量矩阵逆的运算。针对低秩表示模型(LRR),通过将紧致SVD表示与LADMAP方法结合,新算法将求解LRR的计算复杂度从三阶降为二阶。(3)通过从理论上分析LRR解决子空间聚类问题的不足,提出固定秩表示模型(FRR)。我们证明了在满足一定条件下,即使在采样不充分的情况下,FRR模型仍然可以正确恢复出数据集的子空间类别关系。我们还进一步利用FRR模型的机制解决非监督特征提取问题,并分析了其与传统的主元分析方法(PCA)的联系。(4)将广义相对论中的洛仑兹度量引入到降维问题中。通过使用洛仑兹流形来描述数据集的判别信息,提出一种基于洛仑兹度量学习的监督降维方法。该方法可以有效描述数据集的局部类内相似性和整体的几何结构。为了处理计算机视觉领域不同类型的数据,我们还给出了该模型的核化、张量化以及平滑正则化推广。(5)为了克服传统微分方程(PDE)图像处理模型设计困难,可扩展性差等缺点,提出一种基于学习的微分方程图像处理框架,并将其应用到两类典型图像恢复问题中。该方法利用PDE约束的最优控制技术,通过从不同的训练样本“学习”得到特定的微分方程来求解具体的图像恢复问题。