基于属性的零样本学习方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:lijie04113209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着机器学习技术的发展,特别是深度神经网络的出现,目标识别研究取得了巨大的进步。当提供充足的有标签数据之后,这些识别系统的性能和效率甚至超过了人类感知系统。然而,对世界上所有的物体都收集大量的有标签数据几乎是一个无法完成的问题,尤其对于一些罕见目标或者超细粒度类别。因此,在没有给定训练数据的情况下,如何准确地识别未知类的目标成为一个非常具有挑战性但又十分有意义的研究问题。在此背景下,零样本学习问题在机器学习和计算机视觉领域受到了越来越多的研究关注。在零样本学习问题中,训练类别和测试类别不相交,因此零样本学习模型需要引入语义信息来从已知类训练数据中迁移知识到未知类测试数据中。本文以基于属性的零样本学习问题作为主要研究对象,提出了三种提高语义信息的方法和一种改进的监督零样本学习方法。本文的主要研究成果及贡献如下:(1)提出了一种基于双曲邻域图传播的属性学习模型,来从原始的弱监督的类别级别属性中学习得到强监督的样本级别属性表示。目前的零样本学习研究中使用的属性信息是给定的类别级别的属性表示,由于人工标注和样本个体差异性带来的误差,类别级别属性直接推广到具体样本时,得到的样本级别属性是包含噪声的弱监督语义信息。针对此问题,本文提出通过属性学习模型来从给定的弱监督的属性表示中学习得到具有更强监督信息的样本级别属性表示。考虑到双曲空间度量的内蕴性质和相对邻域图的优点,设计了一种双曲邻域图模型来描述数据集中的样本。基于构建的双曲邻域图,定义了样本点的邻域一致性来检测可疑样本点,随后可疑样本点根据其邻近样本的属性表示的期望来修正噪声属性值。大量对比实验证明学习得到的样本级别属性显著优于原始的类别级别属性。(2)提出了一种基于互补属性和排序聚合的零样本学习模型,来增强原始的属性信息。为了充分利用属性表示中蕴含的语义信息,本文引入互补属性作为原始属性的补充,来增强原始语义空间的表示能力。理论分析证明引入互补属性能有效提高零样本学习模型的泛化边界。作为原始属性的一种扩展,提出的互补属性能被轻易地应用到现有的基于属性的零样本学习模型中。在应用到基于概率预测策略的零样本学习模型中时,研究发现概率预测模型存在一个很强的假设,即假设所有的属性表示相互独立,而这与现实不符。为了解决该问题,接着提出了一种新颖的排序聚合模型来避开此假设。大量对比实验证明提出的互补属性和排序聚合模型能显著提高零样本学习模型的性能和稳定性。(3)提出了一种基于未知类合成数据的迭代属性选择模型,来从原始的属性集合中选择出更具鉴别力的关键属性子集。在目前的零样本学习研究中,所有的属性都默认有效并被同等对待。然而经研究发现,部分属性因为其可预测性较低或鉴别力较低,从而会影响整个零样本学习系统的性能。针对此问题,本文提出了一种迭代属性选择模型来挑选出关键的属性子集。因为零样本学习问题中训练类别和测试类别不同,而测试类别的数据在训练阶段不可见,因此设计了一种基于属性的条件生成模型来生成未知类合成数据。未知类合成数据和真实的测试数据具有相同的属性表示和相似的数据分布,因此,基于未知类合成数据的迭代属性选择模型选择出的关键属性子集能有效地泛化到真实的未知类测试数据。理论分析表明迭代属性选择模型能有效提高零样本学习模型的泛化误差边界。大量对比实验证明提出的迭代属性选择模型能显著提高零样本学习模型的性能和稳定性。(4)提出了一种基于端到端设计和元学习的监督零样本学习模型,来提高监督零样本学习模型的性能和稳定性。通过条件生成模型生成未知类合成数据,可以将零样本学习问题转换成传统的监督学习问题进行求解。目前的监督零样本学习模型单独训练数据生成模块和目标分类模块,这样导致数据生成模块的优化目标对于整个零样本学习系统不是最优解。针对此问题,本文提出了一种端到端的监督零样本学习模型。另外,考虑到生成的未知类合成数据存在可靠性较低和域偏移的缺陷,接着引入元学习机制来进一步提高监督零样本学习模型的性能。大量对比实验证明提出的基于端到端设计和元学习的监督零样本学习模型显著优于其他最新的监督零样本学习模型。最后,本文总结了提出的四种方法的特点及其应用场景,并展望了未来可能的研究方向。
其他文献
学位
学位
学位
学位
学位
图像配准是在计算机视觉和医学图像处理与分析领域广泛使用的一种技术。通常意义上,配准是指将两幅或多幅图像中的某些或全部点对应起来,使得它们都对应于成像对象的同一点。因此图像配准的实质就是要寻找两幅或多幅图像之间的一个空间几何变换。图像配准涉及到的几何变换有刚体变换,仿射变换,投影变换和非刚性变换。前三种变换都是图像的整体变换,即图像中每一点的变换参数都一致。而非刚性变换则允许图像中各点的变换参数不一
随着信息产业与网络技术的迅速发展,数据隐私保护作为信息安全建设的重要内容已经成为当今世界关注的热点。近年来,频频爆发的用户、企业甚至国家层面的数据泄漏事件更是将对网络空间安全学科的建设和数据隐私保护技术的探索推在了前列。在研究保护数据安全隐私的过程中,可搜索加密因其在保证数据安全的基础上引入了密文检索的功能而备受关注。其丰富的查询功能与完备的功能体系使可搜索加密在密文数据库的安全建设方面具有重要的
随着空袭武器性能的提高和低空突防能力的增强,对地面武器装备及水面舰艇进行打击的武器飞行速度和机动能力都有了显著提高,由此对中低空防空导弹武器系统在目标瞄准、跟踪和拦截能力等方面提出了更高的要求。导弹发射装置电液伺服系统的控制性能直接决定着防空导弹武器系统的跟踪和拦截精度,因此需要研究其高性能控制方法缩短发射装置的调转时间和提高跟踪精度。导弹发射装置电液伺服系统是高度非线性的系统,其非线性特性主要表
集成电极微流控芯片采用微加工工艺将具有多种结构和多种材料的微电极集成到微流控芯片材料上,从而实现微流控芯片的多功能化,在众多的工程应用及科研生产等领域中有着重要的应用价值和广阔的应用前景。然而,现阶段集成电极微流控芯片的实际制作水平仍然落后于其理论设计水平,集成电极微流控芯片的加工问题成为微流控芯片发展及应用首先需要解决的问题。集成电极微流控芯片的制备大多需要昂贵的设备和复杂的工艺,因此,高效率、
依据《中国卫生统计年鉴》,2019年城镇居民SCAD(稳定性冠状动脉疾病)致死率为100万余,2020年我国卫生服务调查,城乡居民总人数为10.00%,60岁以上老年患病率为28.5%。CNP(临床护理路径)是基于病人的真实状态及病情状况,实施检查、诊疗、用药、训练等步骤,在拟定日程表,确定检查项目、治疗方式、护理手段、疾病程度、出院时间以及其他目标方面,都有详细的叙述和记录。
期刊