【摘 要】
:
在传统监督学习中,每个训练样本由一个训练示例和一个类标记组成。在现实世界的应用中,每个训练示例有可能和多个类标记关联。多标记学习的任务是训练一个预测模型为一个未见
论文部分内容阅读
在传统监督学习中,每个训练样本由一个训练示例和一个类标记组成。在现实世界的应用中,每个训练示例有可能和多个类标记关联。多标记学习的任务是训练一个预测模型为一个未见示例预测一个相关标记集合。传统多标记学习算法把每个类标记当做一个逻辑指示器,来代表该类标记是对示例相关或是不相关,即,用+1代表该类标记对示例相关,用-1代表该类标记对示例不相关。这种由-1或+1代表的标记类型叫做逻辑标记。逻辑标记不能描述不同的标记重要度。然而,在现实世界的多标记学习任务中,每个可能标记的重要度通常是不同。但是,对实际应用来说,直接去获得标记重要度往往是非常困难的。因此需要一种方式将示例的本质的标记重要度从逻辑多标记数据中重构出来。为了解决这个问题,本文假设每个多标记示例的类描述是一个潜在的实数标记向量,每个标记对应的实数值能反映该标记的标记重要度,这种标记被称为数值标记。从逻辑多标记数据中重构出数值标记的过程叫做标记增强。一些和标记增强功能相似的相关算法已经在过去几年中提出。这些方法可以分为两类,一类是基于模糊理论的标记增强方法,另一类是基于图模型的标记增强方法。基于模糊理论的标记增强方法通过模糊方法给每个标记构造模糊隶属度。基于图模型的标记增强方法通过利用特征空间的拓扑结构把逻辑标记转化为数值标记。目前,已经存在一些基于标记增强的多标记学习方法。这些方法都是两阶段方法,即,首先通过标记增强重构出数值标记,然后再根据重构出的数值标记来训练多标记预测模型。本文提出一种单阶段方法叫做LEMLL(Label Enhanced Multi-Label Learning)方法,这个方法把标记增强和模型训练整合到一个统一框架中,其中数值标记和分类器是同时学出来的。大量的实验说明了标记增强可以显著提升多标记学习模型的预测性能,LEMLL算法可以有效地从逻辑多标记数据中重构出潜在标记重要度。
其他文献
多(彳圣)效是GNSS恶劣环境下的重要影响因素之一,近年来,GNSS领域研究者在抑制多(彳圣)和提高智能手机导航性能方面进行了广泛研究。但在某些恶劣环境中,由于GNSS信号无法到
深厚软土地基的处理一直是土木工程中的热门研究问题。由于深厚软土地基存在软土覆盖层较厚、结构稳定性差及承载能力低等问题,这使得各种传统处理方法往往难以达到理想的效
土是颗粒、水和气组成的三相体系,水含量的大小直接影响土体的性质,高含水量土体的强度相对较低、变形较大。特别是对于广泛分布我国西北地区的湿陷性黄土,水的浸入会导致土
土壤微生物是土壤环境中不可或缺的一部分,对整个土壤生态系统至关重要。但随着稀土元素的需求日益增长,稀土矿石开采和提炼过程中产生的大量固体废物对土壤环境构成严重威胁
本文针对淮南采煤沉陷区铁路专用线在不断加高后存在的稳定性不足的问题,提出了用粉煤灰轻质填料代替煤矸石进行复杂工程地质条件下路堤维护加固治理,通过室内试验的手段,研
中药材中的天然药物成分非常复杂,其含有的活性成分的分离纯化是一项艰巨而细致的工作,葛根是一种常见的中药材,其中的活性成分染料木黄酮因其存在一些结构相似的成分并且含
Cu2O是一种理论光电转化效率高、可见光响应、无毒、制备成本低廉的具有发展前景的光催化剂,但在实际应用中存在光催化失活、光催化效率低的问题。本论文以结构均匀的非晶态
布尔可满足性(Boolean Satisfiability,SAT)问题是指,给定一组布尔变元X及由X构成的CNF公式,问是否存在一组对X的赋值,使得公式为真。SAT问题是第一个被证明为NP完全的问题,在计算理论中具有重要地位。如果找到能够在多项式时间求解SAT问题的完备方法,则P=NP;反之,如果能够确定所有SAT算法的最坏时间复杂度下界为指数级别,则P≠NP。此外,SAT问题在电路验证、组合优
三维重建技术广泛的应用在数字城市和考古学领域,目的是还原真实场景和更好的保护文化遗产。目前,常用的三维重建技术有立体测量技术和激光扫描技术,两种方法各有利弊:立体测
随着信息科学的快速发展,个人信息安全变得愈发重要;人脸识别因其所具有的隐蔽性、唯一性等众多优势,成为鉴别个人信息的重要手段。近几年来,针对人脸识别的研究越来越多。在