基于YOLOv4-Tiny的航拍图像车辆检测算法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:ymh19900920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能交通系统可以监控道路状况,是当今交通发展的必然方向。而车辆检测在智能交通系统中有着重要作用,它可以检测车流量,从而为道路交通状况提供各种重要数据。由于航拍图像的背景环境比较复杂,目标比较小且数量较多,遮挡问题比较严重,给航拍车辆的检测带来了困难,所以如何在复杂的环境下提高车辆检测的精确度具有现实的意义。YOLOv4算法代表着目前业界最先进的物体检测水平,它的检测速度超过其他检测系统,实现了速度和精度之间的权衡。YOLOv4-Tiny是YOLOv4的简化版,检测速度更加的快,相比于YOLOv3-Tiny其精度有很大的提升,但在航拍车辆的检测精度方面仍然存在需要改进的地方。因此本文基于YOLOv4-Tiny 网络对航拍图像中的车辆检测问题进行研究。首先提出一种新的图像混叠类的数据增广方法Mixup-Mosaic,并通过这种数据增广方法把背景样本加入训练,来提高模型的识别效果。然后,为了解决航拍车辆小目标检测效果差的问题,本文提出一种改进的YOLOv4-Tiny航拍车辆目标检测算法。首先在YOLOv4-Tiny主干网添加1×1卷积来提高主干网的特征提取能力,然后在把深层特征上采样与浅层特征进行融合得到一个降采样8倍适合检测小目标的检测层,为了不增加模型复杂度,把适合于检测大尺寸目标降采样32倍的检测层去掉,并采用K-means++方法针对航拍车辆重新进行锚框选取,使得锚框更适合航拍车辆的尺寸,进一步提高航拍车辆的检测效果。本文基于单卡NVIDIA GeForce GTX 1060平台,在Visdrone2019数据集上进行实验,对本文提出的改进进行验证。实验表明,本文在使用Mixup-Mosaic数据增广方法把背景样本加入训练的基础上,在改进的YOLOv4-Tiny网络上完成对航拍车辆检测的训练,在测试集上进行测试,mAP达到了 50.17%,相比于原YOLOv4-Tiny网络,mAP提高了 10.14%!说明使用Mixup-Mosaic数据增广把背景样本加入训练的方法以及本文对模型的改进对航拍车辆检测的效果确实有一定的提高!
其他文献
学位
课程思政是落实立德树人任务的重要手段,可以帮助学生树立正确的人生观和价值观,践行社会主义核心价值观。生态学作为生物科学专业的一门核心课程,具有丰富的思政元素,是开展课程思政的良好载体。将OBE理念运用于生态学课程思政建设中,挖掘生态学课程内容中蕴含的思政元素,从课程思政目标优化、教学内容设计、课程教学实施和教学评价等方面构建生态学课程思政体系,并通过教学实践充分发挥生态学课程的育人效果。该课程思政
学位
前不久,住房和城乡建设部发布开展第一批城市更新试点工作的通知,全国21个城市纳入试点,城市更新试点旨在探索建立城市更新统筹谋划机制、可持续模式及配套制度政策。笔者看到,近段时间,一些试点城市公布的城市更新方案,纷纷摒弃了过去常见的“一键重启”式的大拆大建做法,城市更新的观念与行动正在经历从“拆改留”到“留改拆”的转变。
期刊
大数据时代来临,海量的数据促使人们想要高效的挖掘数据和有效的利用数据。聚类算法就是一种常用的数据挖掘工具,在不具备先验知识的情况下,探究数据内在的结构信息和相似关系,通过把多个对象分成不同类簇的方式有效地处理海量数据。因此,它也被广泛应用在各个领域,如:信息提取、模式识别、图像分析、数据压缩和网络安全等。密度峰值聚类算法(Densitypeakclustering,DPC)是近年来比较热门的聚类算
在党百年华诞的重大时刻,发挥党史育人功能优势,推进党史学习教育常态化、长效化,正当其时,确有必要。用好课程教学这一主渠道,将党史学习教育融入课程思政,有助于全员、全方位、全过程提高党史育人成效。面对网络文化、社会环境、教育方式等对党史学习的影响,在“又红又专”的教师队伍引领下,找准党史融入专业课程的切入点,然后展开课程学情分析,完善教学设计,改革教学方法,将专业课程中“隐性”的思政元素“显性”化,
近些年来,随着科技的发展和机器计算能力的提升,神经网络和深度学习技术在自然语言处理领域中得到广泛的应用。在自然语言处理领域里,文本自动生成是一个重要且具有挑战性的研究方向。本文旨在根据给定的主题词生成一段可读性强的、主题相关性大的文本,此任务有以下三个难点:第一,输入信息不足。本文中的主题短文生成任务属于文本到文本的生成,在文本摘要和机器翻译这些任务中,原文本的输入提供了足够的语义信息以生成所需的
小学生编程教育对国家未来科技主导权具有极其重要影响,现已经上升到了国家战略层次。目前针对小学生编程教育平台的应用虽然有了一定的进展,但实际教学中仍存在硬件可编程性较差、设备实用性不足、编程教学案例乏味等问题。针对以上问题,采用SOM-RK3399核心板作为主控设备,集成语音处理模块、STM32控制模块等,设计并实现了一种面向小学生编程教育的嵌入式开发平台,具有研究意义与应用价值。主要研究内容如下:
课程思政与专业教育有效融合是实现立德树人的重要手段。基于“视觉设计”课程的特点,从爱国情怀、中华文化传承创新、科学思维方法、工匠精神、职业素养等方面挖掘课程思政要素,修订课程标准,优化课程思政教学内容及目标,梳理思想政治教育融入点,以期推动“视觉设计”课程思政建设取得显著成效。
文档与查询之间的语义鸿沟是信息检索领域中一个挑战性的难题。伪相关反馈是解决这个问题的一个可行的办法。由于自然语言的复杂性,传统的伪相关反馈方法很难准确判断查询与扩展项之间的语义相关度,因此这种方法不可避免地会引入一些噪音。预训练模型BERT在很多自然语言处理任务上取得了里程碑式的突破,其中Nogueira等人在MS MARCO段落检索任务上,利用BERT模型将检索精度提升了 27%左右。相对于传统