实时视频流物体检测的关键技术研究及实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:weibiechao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的发展,基于深度学习的目标检测技术逐渐成为计算机视觉领域的一个研究热点。然而现有的目标检测算法通常无法做到检测效率和精度的平衡。其次,目标检测算法只能预测物体的边框坐标,无法精确到物体的轮廓,因此如何在保证检测效率的同时,使目标检测算法可以精确到物体的轮廓是一个待解决的问题。此外,由于目标检测数据集的标注较为复杂,需要耗费很多的时间成本以及人力成本,而现实场景中的物体分布和背景通常在不断变化,因此如何在不大量标注数据集的同时,还能保证目标检测算法在多种多样的场景中,仍能准确提取目标特征,具有良好的检测目标的能力,是一个待解决的问题。基于单阶段目标检测算法SSD,本文分别提出了将边缘检测算法和SSD融合的ED-SSD算法以及将域适应方法应用在SSD中的SW-RFB-SSD算法,并将所提出的算法应用在智慧机场检测机舱门的实际场景中。最终ED-SSD算法可以检测精确到轮廓的舱门位置,SW-RFB-SSD算法在不大量标注数据集的情况下,可以检测不同天气情况下各种类型的机舱门,并达到良好的精度。本文的主要工作包括:1、本文提出了将基于深度学习的边缘检测算法和单阶段目标检测算法融合的端到端的网络模型ED-SSD,使得网络在预测物体边框坐标以及所属类别的同时,检测图像中物体的轮廓。并且实验发现,将两个任务的算法融合后,分别提升了各个任务的精度,其中目标检测任务在VOC2012数据集上可以提升2-3个m AP值,在MS COCO数据集上可以提升5-6个m AP值,边缘检测任务可以提升2-3个ODS-F分数。2、本文将ED-SSD模型应用在了智慧机场的现实场景中。基于智慧机场的现实场景,ED-SSD模型可以利用物体轮廓像素坐标修正那些与物体真实位置存在误差的预测边框,从而预测出精确到舱门轮廓的位置,为后续实现登机桥自动精准对接做了前期的准备工作。3、本文提出了将基于深度学习的域适应方法应用在单阶段目标检测算法中的模型SW-RFB-SSD,以单阶段目标检测算法SSD为基本框架,结合了将全局特征进行弱对齐以及将局部特征进行强对齐的思想,使得在不大量标注数据集的情况下,依然可以在目标域数据集上有较好的检测精度。并且为了保证检测效率的同时,进一步提高物体检测的精度,还利用了不同尺度的感受野,使模型可以从训练集中学习到更丰富的特征。4、本文将SW-RFB-SSD模型应用在了智慧机场的现实场景中。基于智慧机场的现实场景,SW-RFB-SSD模型可以在仅对部分类型的机舱门数据进行有监督训练的情况下,直接检测各种外观不同的机舱门,减少了数据集标注的人力成本以及时间成本。
其他文献
随着智能化社会的发展,人们在日常生活中接触各类新闻的方式也已经逐渐从报纸、杂志等传统媒介转变为各种的智能终端媒介,其中智能手机上的各种应用软件便是人们赖以获取信息的重要工具之一。然而对于需要获取特定领域新闻信息的人而言,只有一部分互联网新闻内容符合他们的需求。通过新闻的摘要可以帮助人们实现快速筛选新闻内容的目的,以降低人们获取新闻时的时间成本。新闻内容文本的准确性又会对摘要的质量产生直接影响。本文
无线通信接收机在接收毫米波信号时,由于受到物理信道的影响,接收到的信号往往是变化较大的,这不利于接收机完成对信号的解调。其实,早就有文献指出,在QAM信号的接收机中,解调器的输入端一定要有一个自动增益控制(AGC)系统,以恒定QAM信号的平均功率,否则解调出来的I、Q信号就有可能不平衡,导致通信系统的误码率增加。本文是依据某毫米波接收机的研制项目,来展开对无线通信中自动增益控制技术的研究。本论文研
随着我国经济社会的发展,人们对医疗保健的需求不断提高。同时,国家也出台多项政策助推了医药行业发展。但近年来,行业内乱象依旧存在,多起造假案件的发生反映出我国医药企业对内部控制的重视程度不够。而在内控五要素中,控制环境要素作为其余各要素的基础,对企业内部控制的有效性起着关键作用。由此,选取长生生物内部控制失效事件作为研究对象,探讨长生生物内部控制环境存在的主要问题,并对背后原因进行深入分析,期望为我
置换是一类在密码算法中使用相当广泛的密码学函数,构造具有良好密码学性质的置换是设计好的密码算法的重要需求之一。 MD5是国际上通用的两大Hash函数之一,它被广泛应用于数字签名方案、检测数据的完整性、群签名、电子货币、抛币协议、密钥交换协议等方面,因此MD5的安全性至关重要。 本文共分两章: 第一章,介绍了密码学中的两类完全映射:正形置换和全向置换。本文在全向置换研究结果的
水分是影响干旱区荒漠植被恢复和造林成败的关键因素。保水剂是一种具有超强保水力的新型高分子材料,广泛应用于农业中。本文以胡杨幼苗、灰胡杨幼苗为研究对象,通过对不同保水剂用量、不同保水剂配施氮肥用量的筛选,设计田间试验,研究不同保水剂用量对土壤理化性质、胡杨幼苗生长及光合生理的影响及保水剂与氮肥配施对灰胡杨幼苗生长、光合生理影响的最佳配比,为风沙区荒漠植被恢复,防护林营建和保水剂的应用推广提供理论指导
在全球经济下行的背景下,进行新形势下的战略转型迫在眉睫。针对资本市场,我国连续出台多项政策进行大刀阔斧的改革。我国新三板一直存在挂牌企业估值较低、流动性不足、企业融资困难等一系列问题,导致一大批优秀的新三板企业积极谋求转板。那么,新三板企业如何成功转板并上市,转板的效果如何,是否解决了发展过程中的困境,已成为学术界和实务界亟需解决的热点问题之一。本文以首家从新三板转板登陆科创板的医疗器械企业——南
现实生活中不断产生大量的短文本数据,例如新闻文本,美团、大众点评等网站上用户发表的针对某些方面的评论。文本数据的产生必然伴随着对数据的归类,如何提升分类效率,减少人工成本,这便是文本数据分类的研究方向。此外从这些海量数据中挖掘出用户的情感,有助于精准地刻画用户,从而辅助平台进行针对性的提供服务。然而,目前大多数方法都忽略了文本单词之间的联系或是方面词与上下文之间的联系,导致分类性能表现不好。本文主
西双版纳哈尼族阿卡人是分布于我国西南边陲云南地区的少数民族和跨境民族之一,竹筒舞是阿卡人物质生活与精神文明的结晶,是承载着民族历史文化、生产生活、宗教信仰、思想情感、审美理想的活化石。近年来,哈尼族舞蹈不断出现在大众视野中,不仅被推选为省级非物质文化遗产,也逐渐有优秀的舞蹈作品出现于舞蹈专业赛事中。竹筒舞蹈表现内容多元性、风格动律独特性、外部形态丰富性、文化内涵深邃性,由内而外显示出竹筒舞朴实无华
目前常见的脑功能成像技术包括脑电图、功能磁共振成像技术和功能近红外光谱技术等。脑神经活动会引起血流动力学变化,功能近红外光谱技术利用脑组织中氧合血红蛋白和脱氧血红蛋白红对600~900nm近红外光具有较强的吸收率,从而获得脑神经活动时氧合血红蛋白和脱氧血红蛋白浓度的变化情况。功能近红外光谱技术与脑电图相比具有较高的空间分辨率,与功能磁共振成像技术相比具有良好的时间分辨率,同时f NIRS在设备成本
磁共振成像不仅可以进行结构成像,也可以进行功能成像,因此磁共振功能成像被广泛应用于脑功能研究中。在主磁场强度B0为3.0T及以下的磁共振扫描设备中,常使用平面回波成像序列进行功能成像。平面回波成像序列由于其特殊的梯度编码方式实现了一次射频脉冲激发采集整个K-空间数据,使其能够在很短的时间内完成全脑的扫描,但是这种特殊的成像方式也给平面回波成像序列引入了伪影以及低分辨率的问题。由于功能磁共振成像使用