交通场景图像中的文字识别

来源 :东南大学 | 被引量 : 0次 | 上传用户:zqtoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来深度学习的发展,人工智能技术越来越多地应用到交通场景中。识别图像中的文本目标,是人工智能技术在交通场景中应用的关键环节,在违章处罚、智能驾驶等相关领域起着重要的作用。但由于自然场景的复杂性,目前的文本识别算法在交通场景图像中效果还不能尽如人意。因此,本文选取车牌和交通标志两种交通场景中的重要文本目标为对象,对场景文本识别技术进行深入研究,构建了完整的车牌识别和交通标志识别算法,主要工作如下:针对车牌识别问题,通过对传统车牌识别算法缺陷的分析,本文提出了一种基于深度学习的车牌检测、文本识别二阶段车牌识别算法。车牌检测中,针对车牌的目标特性,本文对YOLO网络进行了轻量化和添加注意力机制的改进。而文本识别中,针对车牌文本特性,本文在CRNN网络基础上进行了添加空间矫正模块和改进特征提取网络的优化。实验结果显示,本文改进有效提升了模型性能。在测试集上,本文算法的识别准确率和识别速度都达到了超过传统算法的水平。针对交通标志识别问题,本文首先根据传达信息方式的区别,将交通标志划分为符号型和文字型两类。为解决现有研究对文字型交通标志关注较少的问题,本文设计了一种通用的交通标志识别算法,算法分为交通标志检测、文本检测、文本识别三阶段。交通标志检测阶段,本文使用YOLOV3网络定位和分类图像中的交通标志。在文本检测阶段中,针对面积较大文本的误检测问题,本文对DBNet网络进行了扩大感受野的改进。文本识别阶段中,为实现竖直文本识别,本文通过在CRNN基础上添加预处理环节的方法,构建了多方向文本识别算法。针对训练数据不足的问题,本文还提出了一种文字型交通标志的图像合成算法。最后,由于缺少文字型交通标志的标准数据集,本文建立了Traffic Sign_ch数据集用于实验。实验结果表明,本文所提出算法在两种类型的交通标志上都取得了较好的识别效果。尤其是对文字型交通标志,文本检测和文本识别的性能均超过了通用场景文字识别算法。通过针对性的改进策略,本文所设计算法在车牌识别和交通标志识别场景中达到了较为理想的性能指标。
其他文献
随着人们对艾灸认识的逐渐加深,艾灸逐渐成为人们现代养生保健的选择。人工艾灸耗时耗力,有着很大的局限性,因此出现了很多灸疗仪器。现代科技的进步加速了灸疗仪器的发展,然而当前相关灸疗仪器质量参差不齐,不仅不能够保证疗效,还会带来相关安全隐患,也不能实现艾灸过程的全自动化。因此本文设计了一款能够复现传统人工艾灸的智能艾灸机器人。首先,针对当前灸疗仪器研究现状的总结分析及社会的实际需求,给出了艾灸机器人的
本文介绍了以粟蓬为原料制活性炭的重要意义。通过实验研究炭化和活化工艺条件,评价了产品吸附性能。栗蓬原料丰富,制活性炭工艺简单,能耗低,成本低,所得产品某些性能接近或优于当前市售活性炭。具有工业生产实际意义。(粟蓬就是板栗的外壳)。
期刊
随着社会经济的发展,近些年来电力需求不断增长,光伏和风电等新能源接入电网也给电网的频率稳定性带来了巨大挑战。传统的电力系统调频主要是由发电侧完成的,但随着大量新能源的接入仅仅依靠发电侧资源进行调频难以有效应对大量新能源并网后的供需平衡问题,电网需要其他调频方式来弥补传统调控方法的不足。动态需求响应(Dynamic Demand Response,DDR)作为一种需求侧资源,其种类多样且调频容量充足
研究背景:乙型肝炎病毒(HBV)感染是我国目前严重的公共卫生问题,患者可从急性感染发展至慢性感染,肝硬化甚至肝癌。目前主要采用以核苷类似物(NAs)为主的抗病毒药物治疗,但是无法彻底清除病毒并且停药后容易复发。HBV抗原特异性CD8+T细胞介导的细胞免疫应答在机体清除病毒的过程中起到关键作用,病毒感染的靶细胞通过HLA-A,B,C等HLA I类分子递呈HBV抗原肽被CD8+T细胞识别,后者分化为C
随着高速、高分辨率数字图像技术的快速发展,数字图像相关(DIC)测量技术已经在结构三维动态变形测量中得到很好的应用。但由于空间分辨率的增加和采集帧率的提高,使得需要传输和存储的数据量也大大增加。尤其是采用多相机网络进行大型结构的动态变形测量时,有限的存储空间往往会制约实验的时长,不能满足破坏性实验的要求。同时,随着DIC技术与现代计算机技术的结合,分布式高速DIC方案将是未来的研究重点,庞大的数据
近年来,越来越多的应用以图的形式表示数据,其中知识图谱(Knowledge Graph,KGs)以其结构化的特点受到了广泛的关注。知识图谱是真实世界信息的结构化表示,能够以机器可读的方式对复杂的数据建模,并且包含了丰富的知识,因此被应用于问答系统、金融、教育等多种行业领域中。然而知识图谱通常是庞大且稀疏的,并且通常是不完备的。另外潜在的三元组符号性质使得它在下游任务中难以被操作,为了解决这些问题,
数字技术的快速发展对传统的新闻生产格局产生了一定的冲击。数字新闻业的出现引起学者对新闻真实特征和判断新闻价值标准的思考。此外,在数字环境下,新闻生产信息来源由静态转化为动态,给核实原始信源带来一定挑战;新闻生产主体由“一元”转化为“多元”,体现全民参与、万物皆媒的特征;新闻生产内容分发由以前的专业媒体机构为中心自上而下“线性”的传播模式转变为多节点、去中心化的立体网络传播,社交平台、智能算法推荐涌
为了掌握黄芪多糖生物活性检测中各因子间的内在联系,试验选用体重18~20 g的昆明鼠40只,按性别和处理分为4组,每组10只进行检测;采用简单相关、典型相关和回归分析的方法对处理方式(x1)、性别(x2)、始重(x3)、脾脏重(x4)、胸腺重(x5)、末重(x6)、脾指数(x7)、胸腺指数(x8)等8个因子进行研究。结果表明:脾脏重(x4)与处理方式(x1)、性别(x2)存在极显著相关关系(P<0