论文部分内容阅读
在21世界的前二十年里,由于广泛的实际应用和场景需要,多标签学习吸引了众多数据挖掘领域和机器学习领域研究人员的关注。随着特征数量的增加,多标签分类这个问题变得具有挑战性,特别是当存在许多相互依赖的特征和标签时。现有方法通过操纵相同的特征集从多标签数据中学习,即在所有类别标签的判别过程中采用每个示例的实例表示。为了实现最大化地利用这些信息和有效地提取特征信息的目的,需要提出了一种更为创新的分类算法和分层嵌入模型来解决多标签图像分类任务,提高图像分类任务的精度。如何设计出有效的多标签分类器以及应对和处理数据标签缺失等情况是图像多标签分类的一大难点。在本文中,我们直接在统一的学习框架中尝试去解决上述的核心问题,由此提出一种全新的多标签图像分类算法,实现不完整标签矩阵修复工作与多标签数据的分类预测工作,其目的是为了分类效果的改善。本文所提出的方法的创新之处在于,一方面实现独立分类器的联合学习,另一方面对多标签分类与标签相关性实现联合学习以及对字典学习与标签相关性实现联合学习,以此达到了处理部分标签缺失问题和样本多标签精确分类难题的目的,除此之外,本文多提的模型还采用了分层嵌入分类器的树状分层结构,每个分支实现一个独立的分类器,该结构有利于实现对样本的精细化分类,本文所提出的算法还利用了矩阵的低秩结构,具体方式是借助利用标签相关性实现对原始数据的不完全的标签矩阵进行修复的操作,有助于进一步提升多标签分类精准度。本文里面所提出的结合分层嵌入的多标签字典分类算法,构建起统一的学习框架使得可以共同进行分类模型与标签学习,完成标签修复工作的同时实现了多标签数据的预测工作,正是因为它们可以在同步学习过程中相辅相成相互促进,所以该算法可以获得更准确的分类模型,此外本算法还利用了标签相关性中包含的附加信息来有效应对了标签信息分类不完整场景下的预测分类难题,在4个具有代表意义的多标签数据集上进行的充分详实且全面细致的实验,用充足的实验结果有力验证了在标签信息不完整的情况下算法的鲁棒性。在完成多标签分类模型算法的设计以及把相关实验配置设定好后,在实验环节安排上,采用了4种常用数据集来参与实验,为了进行实验效果对比,本文选择4种在多标签领域具有代表性的多标签分类方法来比对。此外,本文在实验环节采用多种不同的评价标准进行多维度的结果评估,结合优化求解方法来实现本文所提方法中所涉及的优化问题,在后续的实验对比环节,通过本次实验结果有力表明,在多个评估标准结果里,本文所提算法的表现明显比其他4种多标签分类算法更为卓越,详实的结果有力表明,本方法的优胜之处在于其能允许在半监督的环境进行工作,即能从包含有部分未标记的数据集中学习,相比于较于其他方法,即便是在缺失部分标签信息的恶劣情形下,该算法的鲁棒性具有显著的表现。