论文部分内容阅读
近年来,随着机器学习技术的发展,特别是深度神经网络的出现,目标识别研究取得了巨大的进步。当提供充足的有标签数据之后,这些识别系统的性能和效率甚至超过了人类感知系统。然而,对世界上所有的物体都收集大量的有标签数据几乎是一个无法完成的问题,尤其对于一些罕见目标或者超细粒度类别。因此,在没有给定训练数据的情况下,如何准确地识别未知类的目标成为一个非常具有挑战性但又十分有意义的研究问题。在此背景下,零样本学习问题在机器学习和计算机视觉领域受到了越来越多的研究关注。在零样本学习问题中,训练类别和测试类别不相交,因此零样本学习模型需要引入语义信息来从已知类训练数据中迁移知识到未知类测试数据中。本文以基于属性的零样本学习问题作为主要研究对象,提出了三种提高语义信息的方法和一种改进的监督零样本学习方法。本文的主要研究成果及贡献如下:(1)提出了一种基于双曲邻域图传播的属性学习模型,来从原始的弱监督的类别级别属性中学习得到强监督的样本级别属性表示。目前的零样本学习研究中使用的属性信息是给定的类别级别的属性表示,由于人工标注和样本个体差异性带来的误差,类别级别属性直接推广到具体样本时,得到的样本级别属性是包含噪声的弱监督语义信息。针对此问题,本文提出通过属性学习模型来从给定的弱监督的属性表示中学习得到具有更强监督信息的样本级别属性表示。考虑到双曲空间度量的内蕴性质和相对邻域图的优点,设计了一种双曲邻域图模型来描述数据集中的样本。基于构建的双曲邻域图,定义了样本点的邻域一致性来检测可疑样本点,随后可疑样本点根据其邻近样本的属性表示的期望来修正噪声属性值。大量对比实验证明学习得到的样本级别属性显著优于原始的类别级别属性。(2)提出了一种基于互补属性和排序聚合的零样本学习模型,来增强原始的属性信息。为了充分利用属性表示中蕴含的语义信息,本文引入互补属性作为原始属性的补充,来增强原始语义空间的表示能力。理论分析证明引入互补属性能有效提高零样本学习模型的泛化边界。作为原始属性的一种扩展,提出的互补属性能被轻易地应用到现有的基于属性的零样本学习模型中。在应用到基于概率预测策略的零样本学习模型中时,研究发现概率预测模型存在一个很强的假设,即假设所有的属性表示相互独立,而这与现实不符。为了解决该问题,接着提出了一种新颖的排序聚合模型来避开此假设。大量对比实验证明提出的互补属性和排序聚合模型能显著提高零样本学习模型的性能和稳定性。(3)提出了一种基于未知类合成数据的迭代属性选择模型,来从原始的属性集合中选择出更具鉴别力的关键属性子集。在目前的零样本学习研究中,所有的属性都默认有效并被同等对待。然而经研究发现,部分属性因为其可预测性较低或鉴别力较低,从而会影响整个零样本学习系统的性能。针对此问题,本文提出了一种迭代属性选择模型来挑选出关键的属性子集。因为零样本学习问题中训练类别和测试类别不同,而测试类别的数据在训练阶段不可见,因此设计了一种基于属性的条件生成模型来生成未知类合成数据。未知类合成数据和真实的测试数据具有相同的属性表示和相似的数据分布,因此,基于未知类合成数据的迭代属性选择模型选择出的关键属性子集能有效地泛化到真实的未知类测试数据。理论分析表明迭代属性选择模型能有效提高零样本学习模型的泛化误差边界。大量对比实验证明提出的迭代属性选择模型能显著提高零样本学习模型的性能和稳定性。(4)提出了一种基于端到端设计和元学习的监督零样本学习模型,来提高监督零样本学习模型的性能和稳定性。通过条件生成模型生成未知类合成数据,可以将零样本学习问题转换成传统的监督学习问题进行求解。目前的监督零样本学习模型单独训练数据生成模块和目标分类模块,这样导致数据生成模块的优化目标对于整个零样本学习系统不是最优解。针对此问题,本文提出了一种端到端的监督零样本学习模型。另外,考虑到生成的未知类合成数据存在可靠性较低和域偏移的缺陷,接着引入元学习机制来进一步提高监督零样本学习模型的性能。大量对比实验证明提出的基于端到端设计和元学习的监督零样本学习模型显著优于其他最新的监督零样本学习模型。最后,本文总结了提出的四种方法的特点及其应用场景,并展望了未来可能的研究方向。