基于深度学习的交通标志检测算法研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:imanhuaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断进步,人们的生活也开始步入智能时代。在交通出行方面,与我们最密切相关的就是辅助驾驶和自动驾驶技术。这些技术不仅能够提高我们的出行效率,也能够保障我们的出行安全。因此,对智能交通技术进行研究有着十分重要的意义和应用价值。在道路交通系统中,交通标志是重要的组成部分。不论是辅助驾驶还是自动驾驶,都必须要解决好交通标志检测的问题。但是在实际应用过程中,由于交通标志主要存在于室外,环境较为复杂,受光照、雨雾等因素的影响,摄像机采集到的图像质量相差比较大。另外在图像采集过程中还可能因为拍摄角度、拍摄距离和对焦问题等原因,导致获取的图像存在遮挡、扭曲变形、模糊不清等情况,这些都对交通标志检测带来了巨大的挑战。基于交通标志在检测在实际应用中遇到的这些问题,本文旨在解决复杂环境下的交通标志检测问题,主要工作内容如下:(1)提出了交通标志数据预处理模块TSP。通过对现有目标检测算法的数据预处理方法进行分析,发现了它们在应用于交通标志检测任务中存在的问题,一是在对图像进行缩放过程中容易造成小尺寸的交通标志无法分辨,二是在对图像进行翻转时导致一些指向性交通标志方向发生改变,三是在对图像进行裁剪的过程中没有很好的处理标注信息。因此针对这些问题,设计了TSP预处理模块,在不影响图像质量和交通标志含义的情况下对输入图像进行预处理。并通过实验对比分析,说明了将该模块在交通标志检测效果上的优势。(2)提出了基于注意力机制的SA-YOLOv4-tiny网络。注意力机制是模仿人类观察事物的方式,在深度学习网络中引入注意力机制,能够帮助模型快速聚焦于重要部分,忽略冗余的背景信息。本文通过在YOLOv4-tiny网络加入SA注意力模块,在只增加少量计算的条件下,有效的提高的模型的检测能力。(3)设计出一种改进的YOLOv4-tiny网络。由于交通标志牌本身较小,又多为远距离拍摄获取,因此往往在图像中只占了很小的尺寸。基于这一特点,在交通标志网络设计时应侧重于对小目标的检测。而YOLOv4-tiny网络针对的是通用的目标检测,在设计时并没有注重小目标的检测问题。因此本文分析了不同深度的特征图在信息描述方面的区别,结合特征融合的思想,对YOLOv4-tiny的网络结构进行了改进,从而提高网络对于交通标志检测的效果。(4)提出了基于交通标志检测的TS-YOLO模型。本文通过三个不同的方面对YOLOv4-tiny模型进行了改进,并将改进前后的网络都进行了训练和测试,经过对比分析说明了本文提出的改进方法在交通标志检测上的有效性。最后又将本文提出的三个方法进行了融合,提出一种基于交通标志检测的TS-YOLO模型,并将该模型与YOLOv4-tiny、YOLOv3、Faster R-CNN目标检测算法在TT100K交通标志数据集上进行了对比实验。实验表明,本文的算法在交通标志检测任务中明显优于另外三个目标检测算法。
其他文献
预测性维护(Predictive Maintenance,Pd M)技术在航空航天、轨道交通、机械装备等领域应用广泛,是实现工业现代化的关键技术之一。在“中国制造2025”和“工业4.0”的战略背景下,工业设备正日趋复杂化,工作环境也日渐恶劣。Pd M技术依据设备或系统的传感器监测数据,对其剩余使用寿命(Remaining Useful Life,RUL)进行预测,从而提前采取维护措施,保障运行安
人脸识别是人工智能技术研究中的热点之一,以其突出的高并发性、非触碰性等特点,在安防、监控、移动支付等工业生产领域已有广泛的应用。自AlexNet在2012ILSVRC目标识别领域取得突破性进展,各种新颖的卷积神经网络结构不断涌现。受三维人脸数据集等因素限制,三维人脸识别技术的发展相对较晚,但是随着二维人脸识别技术的发展面临如人脸表情、姿态、遮挡以及光照变化等因素的挑战,研究者逐步转向三维人脸识别的
磁共振成像(Magnetic Resonance Imaging,MRI)技术因其非侵入性、非电离的成像方式,已经广泛地应用在物理、生物、医学等领域,尤其在病灶诊断方面的前景广阔。然而,由于磁共振独特的成像机制,磁共振扫描时间过长,容易产生运动伪影,从而影响重建质量和临床诊断。因此,减少磁共振成像时间具有重要的研究意义。目前深度学习技术与日俱进,在图像重建领域表现突出,因此基于深度学习的快速磁共振
生成对抗网络(Generative Adversarial Networks,GAN)是加拿大蒙特利尔大学的Ian Goodfellow等人在2014年提出的机器学习架构。自提出以来,便受到了深度学习领域研究人员的广泛研究,该架构在图像生成领域取得了巨大的成就。尽管图像生成模型取得了巨大的进步,但其仍然存在生成图像多样性不足、生成的高分辨率图像质量差、模型优化需要大量训练数据等问题。大量的研究人员
自动导引运输车(Automated Guided Vehicle,AGV)是一种移动轮式机器人,属于智能运输设备。AGV是目前无人工厂中的重要组成部分,可以取代人工完成搬运任务。随着制造业的发展和人工成本的提高,自动化流水线也需要相应的AGV调度系统来满足日益增长的任务需求。AGV可以实现物料的高效运输,降低生产成本,因此多AGV系统正在逐步推广。基于以上背景,提出对多AGV路径规划、任务调度和任
掌握自然语言是人类区别其他生物的独特智慧特征,古往今来人们从未停止过对其的研究,近年来GPT-2以及Bert等大规模预训练模型的横空出世,给予了自然语言生成领域内的研究空前的热度。自然语言的生成是有限制的,不同的文体抑或是在不同的语境下都有其独特的约束,于是受限文本生成也成了业内的一个必然要求。深度学习方法往往需要大量的相关数据,然而数据的整理是很繁琐的,并且小的数据量根本不足以使得神经网络拟合。
阿尔茨海默症(AD)的神经影像学自动诊断近年来引起大量关注,但至今尚未有较好的技术手段准确地诊断识别出相关疾病,由于图像识别技术的发展与突破,阿尔茨海默症图像诊断技术面临以下几个问题:(1)传统医学图像诊断技术需要人为提取图像特征,再使用机器学习分类算法,具有较强主观性;(2)AD患者脑部影像具有三维空间的特征,传统二维图像识别算法无法较好提取到大脑中的病理特征。本文针对以上问题,本研究由图像特征
随着无人机技术的不断进步,多无人机协同对地任务规划在现代战争中的地位日益凸显,其规划结果优劣将直接影响无人机整体作战效能。多无人机协同对地任务规划包含两阶段:第一阶段任务分配,即给无人机合理的指派任务;第二阶段航迹规划,即给无人机规划出能安全抵达对地任务目标点的可飞航迹。本文结合某无人机仿真平台的研究,对相关问题展开研究,主要工作内容如下:(1)针对传统合同网算法在解决多无人机任务分配中存在的资源
目标追踪作为现实意义较大的一个视觉算法研究板块,其中长时间的单目标追踪算法则是该板块一个十分重要方向,此前相关算法的解决方式主要以传统滤波为主,近年来,以深度学习为基础的长时间单目标追踪算法性能,正渐渐赶超传统滤波方法,尽管如此,目标追踪任务的难点始终没有得到很好的解决,其中以相似目标的追踪漂移、目标闪入和闪出视野内、目标运动模糊、目标视角和尺度随着追踪时间的不断变化等难点最为突出,进一步地,长时
近年来,基于探针的全局光照算法因其简单高效的特点被广泛应用于实时渲染应用中,如虚拟现实、游戏以及CAD辅助设计等。其基本思想是,通过在场景中离散放置探针对光照信息进行预计算,然后在运行时查询着色点附近若干个探针存储的光照信息进行插值计算而生成全局光照效果。然而,该类算法依赖于逐探针预计算光照信息,导致其难以实时响应动态光照变化。其中,光场探针算法能够生成高质量的间接漫反射和光泽反射效果,但需要逐探