面向少样本场景的语义分割与多目标跟踪算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:liongliong448
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能设备的普及和互联网技术的发展,每天都有大量的视觉数据生成,并在互联网上飞速传播,对这些数据的分析是亟待解决的关键问题。近几年来,很多学者逐渐将深度学习技术应用于视觉数据分析处理领域,并且在人脸支付、文字识别、智能辅助驾驶等领域取得了重大的突破,逐渐成为了解决视觉数据分析的最重要手段,为人们的生活带来了诸多便利。但是到目前为止,基于深度学习的计算机视觉技术仍然存在着很多局限性:需要大量的标注数据用于训练;训练好的模型无法直接应用到新的类别上。这些因素导致计算机视觉的研究和应用受到限制。本文致力于使用少样本学习方法解决现有计算机视觉研究中的标注数据不足的问题,主要贡献概况如下:(1)针对现有少样本分割方法没有充分利用特征之间的关系这一不足,提出了基于特征对比的少样本分割方法。通过学习特征间的关系,提高网络的特征提取能力,并在此基础上设计了少样本分割网络。为了解除训练阶段的批次大小对模型性能的限制,本研究还设计了特征池,鼓励信息跨批次交流,并且结合在线困难样本挖掘方法和三元特征对比损失函数,进一步提高少样本网络的分割性能。(2)针对现有的多目标跟踪方法在目标检测阶段没有利用到多帧信息这一不足,提出基于反馈更新的多目标跟踪方法。该方法将下游数据关联任务的结果反馈给上游检测任务,更新目标检测网络原始输出框的置信度,提高正确的目标框在非极大值抑制步骤中的优先级,进一步优化目标检测的结果,从而提升跟踪性能。(3)结合现实场景的要求定义了少样本多目标跟踪问题,要求算法在少量新类别的标注数据的引导下,具备对该类别的跟踪能力。为了解决这一问题,本研究提出了一种基于迁移学习的少样本多目标跟踪方法,利用基础类别的数据训练得到基础检测模型,然后借助新类别的少量标注样本迁移模型能力并移植到现有跟踪算法中,最终完成对新类别目标的跟踪。(4)本研究在多个数据集上评估了上述方法,并且针对少样本多目标跟踪问题推出了专门的数据集FS-MOT。实验结果表明,本研究提出的多个方法在对应任务上均取得了明显的提升。
其他文献
文本生成图像,旨在基于自然语言文本,生成与文本语义相符且较为逼真的图像。该任务是一个跨模态的研究问题,涉及到自然语言处理和计算机视觉两个研究领域。文本生成图像可以广泛应用到计算机辅助设计,智能医疗以及新闻图片生成等领域,已经成为当前研究的热点问题。早期的图像生成方法大多基于噪音数据生成图像,无法控制生成图像的内容。随着条件生成对抗网络的提出,当前的文本生成图像方法大多基于条件生成对抗网络,利用文本
近十年来,计算机软件技术和智能机器人技术飞速发展,其对建筑设计方法和建造技术也影响巨大。借助强大的开源硬件技术和六轴机械手臂高灵活性的特点,可实现从设计到制造高效的自动化流程。木材作为一种天然可再生绿色建材,在生态节能方面具有较大优势。在现代木结构产业和生产方式快速发展的背景下,机器人木构技术能够作为一种有力的支撑,为木结构的发展带来源源不断的创新动力。本文通过对传统榫卯节点连接形式的改进和优化,
MAX相是一类层状碳化物或氮化物,独特的晶体结构使其兼具金属与陶瓷的优良性能,具有着广阔的应用前景。然而,A元素晶须生长使人们对MAX相结构的稳定性及其在服役过程中的可靠性产生质疑。本课题以Ti2InC为研究对象,从晶须生长的原子来源和驱动力等方面研究Ti2InC表面In晶须生长机制。主要研究内容和成果如下:利用无压烧结法,以Ti、In和石墨粉为原料,通过优化烧结参数及原料组分合成了纯度为94 w
学位
心跳机制是一种保证网络应用程序和网络设备持续运行和服务不中断的常用技术。包括即时通讯软件和物联网系统在内的互联网正常服务均会采用常规的规则心跳机制,其产生的心跳数据包具有明显的规律性和周期性,对应的心跳数据流表现出规则心跳行为。迅速、准确地在海量的网络流量中检测出含有规则心跳行为的心跳数据流并对其进行服务分类,对于互联网的管理和安全防护工作具有重要的意义,也是网络流量分类研究的一个新思路。本论文的
学位
学位
电梯一方面为人们出行带来了极大的便利,另一方面也造成了许多安全问题。目前电梯多采用轿厢安装监控摄像头加后台监控室人工24小时监控的方式来保证电梯乘客的安全,但人工监控存在工作量大,效率低,发现异常不及时等问题。针对上述问题,在江苏省工信厅产业升级项目和苏州市重点产业技术创新项目的支持下,研究并实现了电梯智能监控系统,包括基于深度学习的轿厢禁入目标检测算法和乘客挡门行为识别算法研究以及智慧电梯云平台
学位
学位