面向复杂环境的多标记学习关键技术研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:Superumts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多标记学习中,学习对象通常由一个示例表示,同时该学习对象隶属于多个标记。多标记学习的目的是构建一个能够预测未见示例相关标记的学习框架。多标记学习已在多个领域得到成功应用,比如文本分类,多媒体内容理解和生物信息学。随着应用范畴不断扩展,多标记学习的研究需要适应实际需求,为一些更为复杂的多标记学习问题提供解决方案。基于此,在上述标准多标记学习框架的基础上,本文对一些复杂环境下的多标记学习关键技术展开研究,主要工作包括:(1)针对多标记数据中的“维数灾难”问题,以往的多标记特征选择方法要么直接由传统的特征选择方法扩展而来,要么对标记信息利用不够充分。本文提出一种流形正则项约束的嵌入式多标记特征选择方法MDFS。所提出的MDFS方法从特征空间生成一个低维嵌入,能够拟合标记局部与全局关系进行降维。实验表明MDFS能够生成一个优化特征子集来提高学习性能。(2)针对每个标记具有其独有的内在特征(即类属属性)这一问题,本文提出一种类属属性多标记分类方法MLFC。MLFC构建了一个优化学习框架。在该框架下,类属属性通过稀疏学习的方法找到,同时标记相关性信息映射成额外特征,作为类属属性的候选目标。实验结果验证了 MLFC在多标记学习特别是类属属性学习方面具有优势。(3)针对多标记数据中的特征表征具有多个来源这一问题,本文面向多源(异构)多标记数据建模,提出一种基于多源信息的多标记一致性学习框架MLSO。MLSO首先利用邻域信息得到每个数据源对标记的预估值,然后学习不同数据源的权重得到多标记一致性分类结果。实验结果显示MLSO不仅能结合已有多标记学习方法实现学习性能的提升,还能融合多源信息进一步提高学习性能。(4)针对多标记弱监督学习问题,本文提出一种新的基于标记信息扩增的学习方法MSWL。MSWL从标记信息不完整的多标记数据中挖掘标记“高阶”关系和特征局部结构等辅助信息来训练多标记分类器,不仅能够对缺失标记进行补足,还能同时利用标注数据和未标记数据进行学习。实验结果验证了 MSWL能够处理多标记学习中的弱标记和半监督学习问题。
其他文献
很多物理问题都涉及到双曲守恒律方程,如流体动力学、气体动力学、浅水流和燃烧等,但是大部分的偏微分方程是无法得到理论上的解析解,只能通过一些数值方法求解得到其近似解。特别地,对于非线性双曲守恒律,无论初始条件是否光滑,当经过一段时间演化后,其解都可能产生间断,如激波、接触间断等,双曲守恒律方程的这一特性对于数值方法的构造和数值模拟提出了巨大的挑战。因此,双曲守恒律方程的高精度高分辨率的数值解法,并且
随着点云获取技术的快速发展,三维点云相关技术的研究具有重要研究价值,且逐渐成为国内外学者关注的热点。点云配准与融合技术是三维计算机视觉的基础研究方向,广泛应用于三维重建、遥感分析、导航与制图以及虚拟与增强现实等领域。实际中三维点云具有噪声、离群点干扰、不同程度的遮挡以及密度不均匀等问题,给三维点云融合重建带来很大的挑战。尽管三维点云配准与融合重建中取得了许多有进展性的工作,但仍然存在许多问题亟需解
长余辉发光材料由于其独特的发光特性在安全指示,信息存储,光学防伪和生物成像等应用领域受到了广泛关注。其中,可见光长余辉材料发展较为成熟,并且有部分已经成功商业化。近年来,近红外光长余辉成像由于其良好的生物组织穿透性和低辐射探伤的特点掀起了近红外长余辉材料在生物成像领域的研究浪潮。本论文首先系统地阐述了长余辉发光的特点,长余辉发光材料的种类及其在相关领域的潜在应用,长余辉发光材料的研究趋势。针对近红
爱尔兰物理学家、数学家William Rowan Hamilton于1843年最先提出了四元数的概念。虽然距今已经有一百多年的历史,但是近年来有关四元数矩阵特征值和奇异值问题的研究得到了学者们的高度关注。一方面,四元数及四元数矩阵特征值问题在量子力学、彩色人脸识别等领域有着广泛的应用背景。另一方面,四元数矩阵奇异值分解在彩色图像压缩、图像补全、图像去噪、信号处理、滚动轴承故障诊断,以及脑电图学等方
二氧化碳(carbondioxide,CO2)是大气中最为重要的温室气体,在地球气候系统中起着重要作用。海洋是CO2的重要储库,自工业革命以来吸收了大量人为CO2,对大气CO2含量起着重要的调节作用,目前对大洋CO2的源汇格局问题已经有了较为系统的认识。边缘海是陆地、海洋与大气间相互作用最为活跃的区域,其界面上的碳交换是海洋乃至全球碳循环中最为复杂而又不可或缺的环节之一,是海洋与气候变化科学的热点
随着纳米科学技术的发展,表面增强拉曼和荧光光谱作为等离激元增强光谱技术的重要组成部分受到人们的广泛关注。分子的拉曼和荧光光谱可以提供其丰富的“指纹”和激发电子信息,它为深入理解化学反应中的内在反应机制及过程提供了一个强大的分析工具。因此,等离激元增强光谱(PES)的研究对发展超灵敏的表界面分析技术具有重要意义。为了获得最优的增强效果并对耦合系统中的相互作用及复杂机制进行深入了解,人们需要构建定义明
工业生产中,新型能源的监测与利用的重要性日益凸显,其中能量的有效转换是关键。电子信息、光通信、动力能源、高效储能等领域对太阳能、核能等新型能源的高效获取、转换和存储的需求与日俱增。近年来,一维半导体纳米材料成为新型能源换能研究领域的焦点,其在介观物理和纳米器件中具有独特的应用。其中,直接带隙宽禁带半导体氧化锌(Zinc Oxide,ZnO)纳米线/纳米棒因其稳定的理化特性、独特的表面性质、高水平的
多氯联苯(Polychlorinated biphenyls,PCBs)是一类毒性较强的有机污染物,在环境中广泛分布,且具有典型的环境雌激素效应,可对动物的生殖系统造成损伤。因其难以降解,所以PCBs可在环境中长期存在。PCBs共有209种同系物,按照结构和毒性分为两大类,一类是非二噁英类PCBs;另一类是二噁英类PCBs,这类PCBs的结构和理化性质均类似于二噁英,具有较强的毒性。2,3’,4,
硝化作用是氮循环的重要环节,而氨氧化是硝化作用的关键反应步骤,由两种不同的功能微生物类群氨氧化细菌(AOB)和氨氧化古菌(AOA)在有氧条件下驱动发生。AOB和AOA可利用氨氧化过程的能量同化和固定无机碳以合成自身细胞组分,由于两者的生理特性和固碳途径不同,AOB和AOA在氨氧化过程中利用碳氮的计量关系可能存在差异,但是相关研究尚未见报道。此外,温室气体氧化亚氮(N2O)作为硝化作用的副产物主要由
本文分为两个部分.第一部分为第二章.在第二章中,我们主要介绍了 Littlewood-Paley分解理论和Besov空间的相关基础知识,为后续第二部分的研究提供理论基础和证明工具.第二部分为第三章到第六章,我们研究几类具有分数阶耗散的不可压缩流体力学方程组解的适定性问题,它们分别是第三章中的Boussinesq方程组,第四、第五章的MHD方程组和第六章的Oldroyd-B模型.在第三章中,我们研究