【摘 要】
:
偏标记学习是一类重要的弱监督学习框架。在该框架下,每个对象在输入空间由单个示例来描述,而在输出空间与多个候选标记相关联,但其中只有一个标记为其真实标记。在真实世界
论文部分内容阅读
偏标记学习是一类重要的弱监督学习框架。在该框架下,每个对象在输入空间由单个示例来描述,而在输出空间与多个候选标记相关联,但其中只有一个标记为其真实标记。在真实世界问题中,获取一个对象的真实标记所需的成本非常大或很难获取对象的真实标记,往往很容易获取对象的多个候选标记,而偏标记学习框架能够很好地处理这种情景,所以对于偏标记学习框架的研究已经引起相关领域的关注。偏标记学习问题的难点在于对象的真实标记隐藏在候选标记集合中,解决该问题的关键在于如何对候选标记进行消歧。设计有效的学习算法可以从算法设计的思想出发,包括算法适应和问题转换这两个角度。本文从问题转换的角度对偏标记学习展开研究,主要做了以下两方面的工作:(1)为了利用特征空间的潜在有用信息,本文提出了一个基于特征感知消歧的偏标记学习算法PL-LEAF,将偏标记学习问题转换为一个多输出回归问题。PL-LEAF算法首先基于偏标记训练样本的特征空间信息生成样本的标记置信度信息,然后利用该信息学习一个正则化的多输出回归预测模型,最后预测测试样本的标记为回归模型在各标记上输出最大值所对应的标记。(2)为了减少候选标记的数目,本文提出了一个基于三元纠错输出编码的偏标记学习算法PL-TECOC。该算法首先通过三元编码矩阵将偏标记学习问题转换为多个二类学习问题,然后集成这些二类分类器来预测测试样本的标记。在构建二类分类数据集时,仅依据非’0’编码的标记构建,而忽略’0’编码的标记,因此减少了候选标记的数目,从而降低了偏标记学习问题的难度。实验表明,和多个流行的偏标记学习算法相比,PL-LEAF和PL-TECOC算法在人工数据集和真实数据集上均表现良好的性能。
其他文献
图作为一种较复杂的数据结构,由于可以清晰地刻画任意两个数据元素之间的关系,因此常被用来进行各种研究问题的数学建模。子图查询是一种重要的复杂网络研究分析手段,几乎在
氯丁橡胶(CR)具有优异的力学性能和良好的耐热、耐腐蚀性能,共混和复合改性可以提升其应用价值。用聚氯乙烯(PVC)改性CR可以降低CR制品的成本,但是CR/PVC共混物存在相容性差
随着互联网金融的发展,微商的发展也愈加迅猛。作为新兴起的做“熟人经济”的微商,之所以发展迅速源自于社会资本的作用。尤其在形成社群效应时,社会资本中的社会信任、社会
滑动窗算法是离散正交变换的短时快速算法,该类算法利用重叠滑动的时域窗口截取连续的离散信号,并利用上一个窗口信号的中间计算结果来减少计算量。滑动窗正交变换常用于实时
随着现代无人机控制系统对其各部件的可靠性、准确性要求越来越高,无人机容错飞行控制技术研究引起了相关研究领域的重视。简单自适应控制(Simple adaptive control,SAC)是一种容错能力良好的被动容错控制,通过自动在线校正相关参数、补偿故障影响。实际中,无人机执行机构具有最大幅值等物理限制,特别是故障发生时,这种物理限制使得执行机构很可能进入饱和区,无法达到期望的控制效果。本文在SA
迭代学习控制适合于具有重复运行特性的被控对象,主要目标是寻找控制信号,使得迭代学习控制系统的实际输出在有限时间区间上快速无误差地跟踪上期望轨迹。但在实际工程应用中
遥操作技术已经被广泛地应用在航空航天、深海探索、核工业和医疗等各个领域,有着广阔的发展前景。但由于网络的引入,通信时滞通常不可避免,并且会导致遥操作系统性能下降甚
近年来,随着移动互联网的蓬勃发展,无线局域网技术利用其方便灵活的优势得到了飞速发展,给人们的精神文化生活带来了极大的改善,移动互联网网民的数量也逐年增加。然而伴随着
钙钛矿太阳能电池(PSCs),光电转换效率目前达到23.7%,成为目前世界上太阳能电池研究领域关注的焦点。电子传输层(ESLs)具有接受和传输光生电子并阻挡空穴的作用,是必不可少的一层薄膜。然而,在制备TiO_2 ESLs时需要在450-550 ℃烧结,使其由无定形相转换成锐钛矿相或金红石相,以提高其电子传输性能,得到理想的光电转换效率,这样的条件既增加了生产过程中的能耗,又不能满足在有机基底上制