基于RetinaNet的小目标检测提升方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:a345333488
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
样本失衡困扰目标检测任务良久,目标检测任务中的样本失衡包含了正负样本失衡、难易样本失衡、小目标与大、中目标失衡等。目前,针对正负样本失衡和难易样本失衡,诸多目标检测任务已经做了很好的实践,例如Faster RCNN的RPN结构、Retina Net的Focal Loss从不同角度降低了正负样本失衡和难易样本失衡的影响。小目标在训练总样本中的占比小,导致了小目标与大、中目标间的损失失衡,使得检测模型忽视小目标的训练,小目标的检测性能的降低弱化了检测模型的整体性能。此外,小目标特征少、细节模糊、背景复杂等因素,进一步降低了小目标的检测效果。Faster RCNN、Retina Net的工作仅触及正负样本失衡和难易样本失衡问题,并没有探究小目标的改善方法。本文在Focal Loss基础上,对Retina Net检测框架两种应用场景(道路目标检测、人脸检测)中的小目标问题,提出了有效的改进方案,提升了检测模型的整体性能。文章的主要工作如下:1、在道路目标检测场景下,从目标检测任务中出现的小目标与大、中目标训练损失失衡问题出发,提出一种基于自适应平衡损失(Adaptive Balancing Loss;ABL)的Retina Net目标检测方法,该方法能够增大小目标损失在总训练损失中的比重,使得Retina Net训练的方向往小目标倾斜,更加关注小目标的训练。经实验对比,损失自平衡的Retina Net-ABL对KITTI数据集的平均精度均值MAP得到明显提升,并且对数据集中各类的检测性能都得到了不同程度的提升。2、针对人脸检测中小型人脸易漏检以及人脸检测算法模型大、推理慢的问题,提出轻量级人脸检测模型GFace。首先利用Ghost Moudle和深度可分离卷积参数压缩和加速的优势,结合注意力模块Lambda Layer,提出具有上下文学习能力的Ghost bottleneck-v2结构,进而设计出轻型主干特征提取网络Ghost Net-L。之后在Retina Face架构下,结合可变形卷积DCNv2优秀的小目标拟合能力,设计出轻量级人脸检测模型GFace,最后借助自适应平衡目标训练损失的方法,实现了人脸检测模型轻量化、近实时、精确度的并存。
其他文献
无人机技术的迅速发展和机载电脑处理能力的快速提升,为无人机目标追踪技术提供了广阔的应用前景。在无人机目标追踪技术的真实应用场景中,很容易因为目标的高速移动或者相机视野的短暂丢失而导致目标追踪飞行任务执行失败,进而导致无人机难以控制甚至引发危险。因此,研究一套硬件和软件稳定性强的目标追踪系统对于无人机应用具有重要意义。所以本文从硬件、软件以及算法这三个角度去设计一套完整的无人机目标追踪系统,本文的主
量子通信基于量子力学的基本原理保护信息安全,在理论上拥有无条件的安全性,近年来引起了广泛的关注,正在逐步走向工程实用化。量子通信主要包括量子密钥分发、量子安全直接通信(QSDC)、量子秘密共享、量子隐形传态(Teleportation)、量子密集编码等;其中前三者被统称为量子保密通信或者量子密码学。量子纠缠作为量子力学的特性之一,在量子保密通信领域有着众多的研究和广泛的应用。本文的主要内容是基于纠
近些年以来,红外小目标检测任务受到非常多的关注,在海上监控和预警系统当中的应用较为广泛。传统的红外图像小目标检测方法非常依赖手工特征的设置,导致模型不稳定,难以适应场景的变化;而使用深度学习直接检测的方式也因为尺度问题很难检测到真正的小目标。为了更好地实现对红外小目标图像的检测,本文提出了一个基于纹理增强的红外小目标分割检测网络GSTD-Net,并在其基础上构建了一个强弱监督联合的网络损失函数,具
由于自然灾害种类的多样性和突发地点的不确定性,应急通信系统需要满足多种复杂环境下的信号覆盖和大带宽的需求,同时体积小、易于部署。软件无线电技术的思想是采用通用硬件来设计通信系统,在基带端使用软件的灵活处理来兼容多种信号的制式,以此缩小通信系统的整体尺寸,具有灵活性高、便携的优势。本文采用软件无线电架构来设计多天线数字波束赋形电路将充分发挥数字波束赋形在信号覆盖、提升带宽等方面具有明显的潜力,同时又
颗粒间的胶结物可以显著改变颗粒料的力学行为,提高颗粒料的力学性能。水泥基胶凝材料在颗粒堆积体中流动附着形成的胶结结构对胶结颗粒料的力学特性起着决定性作用,胶凝流体在颗粒堆积体中的附着行为与流变参数密切相关。本论文首先通过流动附着试验分析了浆体附着量随浆体流变性能的变化规律,其次通过CT扫描技术分析了浆体附着结构与浆体附着量之间的对应关系,最后通过理论分析推导了胶结颗粒料强度与浆体附着量的理论模型,
【目的】急性肾损伤(acute kidney injury,AKI)发病率高,并且增加慢性肾脏病(chronic kidney disease,CKD)和终末期肾脏病发病风险,造成巨大社会负担。如何防止急性肾损伤向慢性肾脏病转化是亟需解决的问题。核苷酸结合寡聚化结构域样受体蛋白3(nucleotide-binding oligomerization domain[NOD]-like recepto
逐次逼近式(Successive Approximation Register,SAR)模数转换器(Analog to Digital Converter,ADC)具有功耗低、面积小、结构简单等优点,因此被广泛应用于医疗可穿戴设备、航空航天和工业测量等对ADC采样率要求不高的领域。而近些年来,由于工艺技术的改进和设计能力的提升,使得SAR ADC成为高速ADC中的研究热点。本文对中等精度的高速SA
目的:组织工程气管为长段气管重建提供了良好的修复材料,极大程度改善了长段气管缺损(或狭窄)患者的预后,提高了术后生活质量。但目前基于静电纺丝和间充质干细胞的组织工程气管存在诸多问题,构建过程耗时长,常用的含有TGF-β3的软骨诱导体系效率低,所得软骨细胞表型不稳定。在本研究中我们将小分子化合物Karotogenin(KGN)预处理与TGF-β3常规诱导进行结合,以提高间充质干细胞成软骨分化的效率,
Wnt/β-catenin信号通路在控制细胞的增殖、分化和生存中都发挥着重要作用。β-catenin作为传递该信号的核心分子,其蛋白稳定性受到精密调控。一旦Wnt/β-catenin信号通路的成员发生基因突变导致调控紊乱,过量的β-catenin就会累积,最终促进细胞恶性增殖。许多癌症,尤其是结肠癌,已经被证明是由于过度激活的Wnt/β-catenin信号导致的。因此,通过特异性降解β-caten
植物病害的自动识别对我国农业发展十分重要,快速高效的识别方法可以大大减少植物病害对农业从业者造成的经济损失。针对植物病害图像识别问题,利用深度学习网络可以以端到端的方式学习,从而获得更好的识别效果和更高的识别效率。本文以深度学习方法为基础,引入动态领域自适应方法来解决植物病害图像识别任务中样本数据量少的问题,引入基于Transformer的细粒度识别方法来解决同类植物不同病害之间难以识别的问题。本