基于边缘引导稀疏自注意力机制的车牌检测与识别算法设计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liongliong442
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动车牌检测和识别系统在智能交通中扮演着重要角色,它具有从交通控制到安全管理等多种潜在应用,积极推动智慧城市的建设。目前,自动车牌检测和识别算法是一种成熟但不完善的技术,在特定场景表现良好,但在现实复杂场景下仍不够准确和鲁棒,导致应用范围受限。因此本文对车牌检测与识别算法进行了深入研究,设计了适用于复杂场景下的车牌检测与识别算法。本文的主要研究内容如下:(1)基于边缘引导稀疏自注意力机制的车牌检测算法研究。针对复杂场景下有大量干扰因素影响车牌检测精度,本文从图像滤波和稀疏重构的角度提出了一种新颖的边缘引导稀疏自注意力(Edge-Guided Sparse Attention,EGSA)机制。边缘引导稀疏自注意力机制抑制噪声的同时关注车牌的可区分性特征区域和重要的边缘特性,使模型在复杂场景下定位更加精确。针对基于无锚(Anchor-free)的检测方法可能会在偏离目标中心的位置上产生很多低质量预测框的问题,设计了一种简单且有效的方法,称为水波纹损失掩码(Water Ripple Loss Mask,WRLM),以抑制那些低质量预测框,提高整体性能。本文设计的车牌检测算法在最大和最多样化的中国城市停车场数据集(Chinese City Parking Dataset,CCPD)和面向应用的车牌识别数据集(Application-Oriented License Plate Recognition dataset,AOLP)上实现了最先进的性能。(2)基于门控线性单元的车牌识别算法研究。针对中国车牌号码具有标准定制规则的特点,可将其看作是一种语言语法规则,本文从语言建模的角度出发,提出基于门控线性单元(Gated Linear Unit,GLU)的车牌识别算法。采用并行化计算的门控线性单元并结合宽卷积构建语言建模模块,学习车牌号码的语法特性,得到结构化信息。通过增加语言约束,在包含各种复杂场景的CCPD数据集上实现了更高的识别准确率,此外并行化的模型也非常适合现代硬件设备。(3)自动车牌检测和识别系统设计。本文基于自动车牌检测和识别系统的设计目标将所设计的车牌检测算法和车牌识别算法以及交互界面集成为一个系统。此外,为了进一步提高系统性能,即在保证准确率的前提下大大减少模型参数量,本文设计了轻量化的车牌识别模型。本文所设计的自动车牌检测和识别系统适用于复杂场景,具有更广泛的应用场景以及较强的实用价值。
其他文献
医院建筑区别于其他民用建筑,有服务人群特殊、功能繁杂、医疗流程和工艺复杂等特征,而医院项目建设本身也有自身的特点,如:管理难度大、要求高、影响大、造价高、工程变更多等,由此导致医院建设项目前期造价风险性大、控制难度高且不易管理。为经济、合理地控制医院建设项目的造价,必须对前期阶段存在的风险性进行有效管理,为后续造价风险控制提供可靠依据,进而实现造价风险管理目标。为此,本文的研究内容主要包括以下几点
公路货物运输是我国综合运输体系中至关重要的一环,承担了货物短途运输、“门到门”运输的重要责任,在社会和经济发展中具有举足轻重的地位。随着交通基础设施的不断完善、公路货物运输的不断发展,我国各级交通主管部门愈发重视公路货物运输的统计分析工作,但实践中采用的公路货物运输统计分析方法仍停留在传统方法中,公路货物运输信息化、智能化统计分析仍有待深入发展。近年来,交通信息化发展已初现成效,交通数据的不断积累
近年来,心血管病成为我国疾病负担和居民死亡的首要病因。随着医疗服务的信息化管理和数字化发展,医疗领域积累了大量的自由文本。如何从这些数据中提炼信息,并加以管理及应用,是推进智慧医疗建设的关键问题。本文旨在从心血管临床诊疗文献中自动提炼出有效的辅助诊断信息构建心血管知识图谱,并应用于自动问答系统,为医患提供高效精准的心血管资讯服务。具体内容如下:(1)研究基于多头标注和负采样的非结构化知识抽取。针对
我国的城市海岸线因周边生活需要和商业开发所需,有统一搬迁老港区、重新规划至新港区的需求,其投资建设具有一定风险,本文以海口XH港汽车客货滚装码头一期工程为案例,对BT&EPC模式下港口项目投资建设方的风险进行分析研究。本文首先通过专家访谈法对BT&EPC模式下港口项目投资建设方的风险进行识别,发现主要有下列风险:政策风险、市场风险、金融风险、自然风险、不可抗力风险、管理风险、成本风险。其次运用AH
随着社会人口老龄化发展,以人体为中心的无线通信网络将在医疗领域得到广泛应用。可穿戴天线,是保障无线通信可靠和稳定的重要元件,具有非常重要的研究意义。由于人体的电特性,可穿戴天线设计具有一定的挑战性。基片集成波导(SIW)结构,由于其简单的结构和出色的电磁屏蔽性能,非常适用于穿戴式天线的设计。将SIW结构的天线集成在可穿戴纺织材料上,可以保持人体舒适度的同时提供高效稳定的性能。本论文由国家自然科学基
高分辨率图像能够提供丰富的图像细节,帮助完成高级视觉任务,如识别、分割和检测等。它在很多领域有着广泛的实际应用,如遥感图像、医学图像、卫星图像、视频监控和生物测定等。获取高分辨率图像最直接的方法就是使用更好的硬件设备。受限于硬件制作技术和高昂的设备成本,该方法难以大范围使用和推广。图像超分辨率方法,可以从低分辨率图像中生成高分辨率图像,满足人们对于高分辨率图像日益增加的需求。近年来,深卷积神经网络
声学场景分类(ASC)是一项与机器听觉领域相关的任务,其重要作用是识别和分类描述场景位置的预定义标签中的音频数据。在大多数先进的ASC算法中,手工特征和单尺度深度特征被用作后端分类器的输入。由于音频信号的噪声特性以及每一类声学场景的时频特性变化很大,这些特征不能有效地表示不同声学场景之间的特征差异。因此,尽管许多研究者做出了很大的努力,但ASC的任务仍然具有挑战性,仍然是一个有待解决的问题。受多尺
木质素是自然界储量最丰富的生物聚合物之一,被视为是许多高附加值产品的潜在原材料,因此木质素的高值化利用日益受到重视。木质素作为自然界中唯一能大量提供可再生芳基化合物的非石油基资源,是生产碳材料的理想前体。将来源广泛、价格低廉、碳含量高的木质素转化为具有高附加值的纳米碳纤维柔性电极材料,并将其应用于超级电容器中,不仅能充分利用作为造纸工业副产物的木质素,而且可有效缓解能源紧张问题。本文以木质素为碳源
近些年的西班牙电影,往往是以小成本惊悚片的面貌出圈,并逐渐获得关注。西班牙惊悚电影给人的感觉是,总有惊喜。惊喜一方面来自故事情节的精妙设定,带领观众进入思维的活跃运转,另一方面,又都具有细思极恐的强烈后劲儿。《吾栖之夫》《黑暗面》《看不见的客人》,无不如是。《饥饿站台》依旧沿袭了西班牙电影人驾轻就熟的惊悚路线,稍有不同的是,影片中或明显或隐晦的隐喻象征,将赤裸裸的视觉冲击直接转化为直抵内心的惊惧,
期刊
胶囊机器人作为一种新型胃肠道检测设备,不仅能够避免传统检测方式给检测对象带来的不适,还扩大了检测范围,能够检测到传统检测方式的检测盲区。随着胶囊机器人的发展,其搭载的功能也越来越多,这也导致胶囊机器人的能耗不断增加。无线能量传输技术则给胶囊机器人带来了新的供能方式。本文对国内外胶囊机器人无线供能系统的研究现状进行了分析,发现现有的大部分样机系统的发射线圈临床使用不便,并且系统参数还需要进一步优化以