【摘 要】
:
由于飞机在民用和军用领域发挥着至关重要的作用,随着高分辨率卫星遥感技术的迅速发展,遥感图像中飞机检测问题越来越受到人们的关注。随着图像处理以及深度学习的发展,近年来飞机检测的效果得到了有效提升。然而,由于遥感图像覆盖面积广阔,背景复杂,目标繁多,影响对飞机特征信息的提取,图中某些明显的或者结构上类似飞机的物体容易被错检为飞机;另一方面,检测任务中在计算边界框损失时一般使用Smooth L1损失函数
【基金项目】
:
河北省自然科学基金项目(No.F2017202145);
论文部分内容阅读
由于飞机在民用和军用领域发挥着至关重要的作用,随着高分辨率卫星遥感技术的迅速发展,遥感图像中飞机检测问题越来越受到人们的关注。随着图像处理以及深度学习的发展,近年来飞机检测的效果得到了有效提升。然而,由于遥感图像覆盖面积广阔,背景复杂,目标繁多,影响对飞机特征信息的提取,图中某些明显的或者结构上类似飞机的物体容易被错检为飞机;另一方面,检测任务中在计算边界框损失时一般使用Smooth L1损失函数,而检测框的评价标准为IoU,二者相关性较弱,使得生成的检测框与目标偏移较大;并且在遥感图像中飞机密集,传统的NMS算法容易产生漏检。针对上述问题,本文提出利用反卷积和位置注意力模块提取飞机结构特征,减少错检;以GIoU作为检测框评价标准,提出了基于GIoU的边界框损失函数,对二者进行统一,从而得到最佳检测框;同时提出基于GIoU的软决策NMS算法(GIoU-soft NMS),减少聚集目标的漏检状况。主要研究内容如下:首先,针对图像中比较突出的目标容易被错检为飞机的问题,引入反卷积模块以改进特征金字塔的生成。由于遥感图像从上到下拍摄得到,飞机的结构信息明显。为了能够提取飞机的结构特征,使用反卷积模块,增加其对飞机结构信息的提取能力,从而提高飞机特征的表达能力,减少错检。其次,针对相似结构带来的错检,使用位置注意力机制来捕获特征图在任意两个位置之间的空间依赖关系,从全局视野自适应地整合相似的特征,突出飞机特征,抑制背景信息,增强特征表示的判别性,从而区分复杂背景中与飞机结构相似的目标。第三,针对Smooth L1损失函数和IoU作为检测框评价标准关联性弱的问题,采用GIoU作为检测框评价标准,提出基于GIoU的边界框回归损失函数,实现了评价标准与损失函数之间的一致性,使得生成的检测框更加靠近目标。最后,针对传统NMS算法在检测聚集飞机时容易漏检的问题,提出了基于GIoU的软决策NMS算法,避免了在重叠率较高的情况下直接删除检测框从而导致漏检的情况。结合上述方法本文提出基于结构特征和GIoU的飞机检测模型,该模型既增强了对飞机结构特征的提取能力,又提高了检测框的生成能力。在DOTA和DIOR两个数据集上对上述方法进行验证,结果表明该模型能够有效减少飞机检测中的错检,优化检测框的生成,减少漏检,提高飞机检测精度。
其他文献
随着科学技术的发展,现有的单一聚合物材料已经不能满足需要,聚合物共混是获得高性能材料的重要方法,不仅价格低廉,而且能综合各组分自身的优势,使其在性能上优势互补。然而大多数聚合物是热力学不相容的,因此添加相容剂成为提高不混容聚合物共混体系性能的关键。本课题的主要目的是制备一种新型大分子接枝氧化石墨烯复合型相容剂以提高聚酰胺6(PA6)/聚丙烯(PP)的相容性,获得高性能的共混材料。首先将氧化石墨烯(
电流型多电平PWM整流器具有输出功率大、开关频率低、网侧电流谐波小以及直流电压低于网侧电压峰等优点,有效解决了当前电力电子器件功率处理能力与开关频率之间的矛盾关系,在电动汽车充电桩、感应加热等大功率场合有着显著优势。另外,随着近些年来超导储能技术的不断发展,解决了电感储能问题,因此电流型多电平PWM整流器有着广阔的应用前景。结合以上优点,本文针对三相电流型五电平PWM整流器进行了深入的分析和研究。
双枝模糊集(简称为BBFS)与R-Fuzzy集是普通模糊集的两种推广形式.对双枝模糊集而言,它的提出解决了工程决策与工程控制中一些未能解决的问题,且较传统的模糊集有更强的表达不确定性的能力,因而在学术界及工程技术界引起了广泛的关注.对R-Fuzzy集而言,亦把双枝模糊集作为特例,基于R-Fuzzy集构造了新的模糊系统,提高了不确定系统建模的灵活性,扩展了模糊系统应用的范围。80年代初,汪培庄教授提
目的:探索常态化疫情防控时期基层医院疫情防控应对管理模式。方法:以江苏省某乡镇医院新冠肺炎疫情防控工作实践为基础,深入分析基层医院疫情防控工作存在的难点问题,进而提出基层医院构建常态化疫情防控应对模式的建议。结果:基层医院的疫情防控尽管采取改造诊疗流程、设置院感督导组、科学动态排班等积极应对措施,但医院感染防控困难、老年患者就医困难、人力资源不足和医院运行压力大等难点问题非常突出,需要加强多方投入
随着移动云计算、大数据、人工智能、5G技术的飞速发展,我国进入了全新的工业4.0时代。当前小微互联网企业通过手机移动端和互联网客户端提供信息服务平台种类越来越多,如快手、抖音等,这些软件产品的火爆引发了数据规模呈爆炸式增长。面对这些数据,怎样快速准确地挖掘出有用信息是十分关键的,而这些平台都创新性地提出自己的核心推荐算法让用户被动式地接受他们感兴趣的信息。在这种发展背景下,平台下的推荐算法成为了一
近年来,计算机技术飞速发展,人工智能技术被越来越多地应用到医疗领域,辅助医生诊断治疗。磁共振成像(MRI)检查是一项疾病检查的有效方法,在心脏疾病的治疗过程中有着非常重要的作用。心脏MRI图像中不同组织的分割是心脏疾病治疗中的关键步骤,但是由于医学成像技术的限制和医学图像本身具有的特点,如边界模糊、灰度不均匀、影像重叠等,使得图像的分割任务困难重重。针对这种情况,本文提出了一种基于深度学习的心脏M
随着信息时代的飞速发展,数据规模增大与数据维度增高,造成数据处理愈发困难,从而导致“数据灾难”。降低数据维数是降低高维大数据处理难度的重要手段,流形学习作为一种数据降维方法,能够保持高维数据的原始拓扑结构,并提取数据内在特征。但传统的流形学习算法存在一定问题。一方面,基于谱分解的流形学习方法需要求解矩阵的特征值,具有较高的空间复杂度和时间复杂度,难以适应大规模数据的降维要求。另一方面,单机环境下的
课程思政建设是高校落实立德树人根本任务的重要举措,是思想政治教育工作深化演进的创新举措。从课程思政概念提出到课程思政建设工作确立,从课程思政全面推进到课程思政高质量建设,课程思政教学模式适应立德树人的内涵发展与时代需求,与思想政治理论课同向同行、形成协同效应,取得了较好的育人成效。本文例选课程,以彰显湖湘职教品牌特色的百年楚怡精神为引领,将民族精神铸魂、求知精神培根、工匠精神渗透、创新精神塑造贯穿
微表情是在当人试图掩饰或压抑某种情绪时所产生的持续时间极短、强度极弱、且不受自主控制的表情。微表情往往隐藏着人的真实情感,因此自动微表情识别在临床医学、商业谈判、司法调查、心理治疗和谎言识别等领域有着广泛应用。目前现有的传统微表情特征提取方法存在着对时域信息提取不足、对噪声的鲁棒性较差等问题,基于深度学习的微表情特征提取方法因为数据库样本较少,存在着深度网络不能快速有效提取微表情细节特征等问题。针