基于标签依赖关系的多标签分类方法

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:xiaoshen1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签学习广泛应用于文本分类、图像标注、视频语义注释、基因功能分析等问题。近年来,多标签学习日益受到学术界和工业界的关注,成为机器学习领域中的研究热点,并且取得了显著的进步。然而,多标签学习经常受到标签数量、标签之间依赖关系、标签缺失等影响,多标签学习仍然是一项极具挑战的研究。标签之间依赖关系是复杂且重要的因素,它的有效学习会丰富数据表示的内涵,对提升多标签分类性能产生重要作用。因此,多标签分类主要面临以下挑战:不同标签之间存在关联性,并且关联性存在较大差异;随着标签数量的增长,标签之间依赖关系变得复杂,并且面临时间和空间复杂度的挑战;以及标签依赖关系在标签缺失问题中的应用。本文针对上述问题提出了两种多标签分类模型,主要工作和贡献如下:提出了基于神经网络探究标签依赖全局关系的模型NN_AD_Omega。考虑到不同标签之间存在不同的相关性,本文构建了标签依赖全局关系矩阵来刻画标签之间的依赖关系。该矩阵关于主对角线对称,主对角线表示每个标签与自身的依赖关系,并且该依赖关系最强。NN_AD_Omega模型的优势在于在神经网络的顶层加入标签依赖全局关系矩阵,在输出层增强标签之间的知识共享。同时,标签之间依赖关系的学习通过充分挖掘数据内在本质特点得到,能够在出现样本部分标签缺失的情况时,弥补标签缺失所带来的误差,从而有效地提高预测标签信息的能力。在四个标准多标签数据集上的实验表明提出的算法能够探究标签之间的依赖关系和处理标签缺失问题,并且有效提升了多标签分类的性能。提出了基于监督主题模型探究标签依赖局部关系的模型BooMF_LLDA。随着标签数量的不断增长,构建标签依赖全局关系矩阵越来越庞大,矩阵更新的时间和空间复杂度越来越高。为了降低标签依赖关系矩阵的时间和空间复杂度,本文构建了标签依赖局部关系矩阵来刻画标签之间的依赖关系。该矩阵通过对数据-标签表示矩阵进行布尔矩阵分解得到,数据在隐标签空间的表示也可同时获得。该方法将数据-隐标签表示矩阵应用到监督主题模型中作为训练阶段隐主题分配的监督信息。监督主题模型为每个特征所分配的主题与该数据所拥有的隐标签一一对应。在两个标准多标签数据集上的实验表明提出的算法能够探究标签之间的依赖关系,并且有效提升了多标签分类的性能。
其他文献
目的分析小剂量氧气持续雾化湿化对降低人工气道患者肺部感染的临床疗效。方法选择新疆石河子纺织医院人工气道患者148例,随机分为研究组和对照组,各74例。研究组采用持续小
2018年中美贸易摩擦对国内产品出口带来的影响,已延伸到制造产业,钢管生产企业也同样受到影响。我国作为全世界10大无缝钢管生产国之一,钢管产品市场主要为国内市场,英国与法
双排线束连接器(以下简称双排线束)检测的目的是将装配不合格的缺陷线束检测出来,这些缺陷产品通常表现为缺线、排线位置装错、正反面装反。目前,工厂里的检测方式为人工目检,存在的缺点有:易疲劳、人工成本高、效率低,不能满足现代化生产的要求。本文基于机器视觉检测技术,设计出一套完整的双排线束视觉检测仪,实现对双排线束缺陷的检测。本文主要研究内容如下:首先,根据机器视觉检测原理和双排线束检测需求,在硬件部分
随着我国各种类型的施工工程深入开展,对于爆破技术的应用也越来越广泛。今年来,随着施工工程越来越需要在复杂的环境中进行,因此,复杂环境下的爆破尤其是高边坡控制爆破,成
目的探究分析对复发性念珠菌性阴道炎患者采取克霉唑与氟康唑联合治疗的临床效果。方法选择我院2013-01—08接收治疗的85例复发性念珠菌性阴道炎患者作为临床研究对象,运用数