基于深度学习的工业场景箱体字符识别与判断研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:TORO_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展,以深度学习为基础的人工智能不断应用在医疗、金融、安防等领域。同时,国家对制造业转型与升级十分重视,并采取多种有利举措,促进产业发展与“新经济”发展战略落地。因此以深度学习为基础的相关技术和方法也开始在工业领域出现,以科技赋能产业,促进工业制造向智能制造迈进。工业质检是制造业进行商品生产的一个重要环节,是提升产品质量与工艺技术水准、规范生产作业的重要途经。工厂将商品放入包装箱内是生产流程的必要一环,包装箱上印刷的产品批号和生产日期信息具有重要意义,出厂前须确保字迹清晰完整,不能出现漏印、错印、空白箱等情况,否则影响商品的流通与销售。目前,工厂中商品包装箱上字符文本检查的相关方法和应用产品较少,且实时性与效果不佳,主要处于人工检查阶段,未能实现实时自动化全覆盖检查。商品包装箱上的字符文本检查,可以利用光学字符识别的相关方法,实现生产线智能化箱体字符识别判断与商品全覆盖。针对上述应用场景与需求,本文提出了基于深度学习的工业场景箱体字符识别与判断算法,具体的研究工作如下:(1)本文针对应用场景建立了工业场景商品外观信息数据集。通过在工厂车间的生产线上布置工业相机与触发器等设备,对生产过程中的商品包装箱两侧进行图像实时采集,由于商品外观信息会随着季度更新变化,数据集中的箱体图像也会根据需要进行更新扩充,以保证算法应用的效果。(2)本文在商品箱体字符检测阶段应用了基于YOLOv3网络优化改进得到的G-YOLOv3,通过合并卷积层与批量归一化层,推理速度提升22%;通过引入GIo U,m AP提升7.5%,同时训练过程的收敛速度更快。由于检测网络的定位边界框在部分图像上出现无法包含完整字符文本的情况,而造成切割图像时字符残缺影响后续字符识别的问题,本文提出了边界框的调整方法,成功地解决了上述问题,为字符识别做好准备。(3)本文在商品箱体字符识别阶段采用了Tesseract,放弃了先分割后识别的方法,对原模型进行调优训练得到新的模型,使得箱体字符文本的置信度得到至少10%的提升。对文本区域图像采用高斯滤波、自适应阈值二值化等图像预处理操作,提高字符识别正确率。由于车间内各条生产线上的光线存在差异,导致拍摄获取的图像表面光线条件较差,文本区域图像明暗不均,进而对自适应阈值算法中的局部区域大小有不同的适用值,因此,本文提出了局部区域大小调整方案,来解决不同生产线不同商品箱体图像对局部区域大小有不同适用值的问题。(4)本文在商品箱体字符识别结果匹配判断阶段采用了自主设计的识别结果字符串分段匹配的方法。商品外观信息会随季度更新,以及拥有相同商品外观信息的图像由于光线的影响而存在差异,模板匹配方法需要人工定期更换模板图像,给算法的应用增加了人工成本。本文设计的识别结果字符串分段匹配的方法,从字符文本入手,与工厂管理系统相配合,减少了人工操作,使得算法更具自动化。(5)本文为了验证算法的有效性和应用前景进行了工厂生产线实测,实现了生产线上的商品全覆盖与实时监测,对每件商品完成拍照、检测识别和输出结果共耗时3.5秒左右,准确率达到了99.5%。
其他文献
近年来,基于图像的人脸处理技术在许多领域得到广泛应用,例如:用户识别、公共安全、人机交互等领域。人脸识别技术在深度学习的助力下,其识别率得到显著提升。由于单模态数据的识别在应用中存在一定的局限性,且人们获取多模态数据更加便捷,因此多模态人脸识别已经成为科技发展的趋势。然而,多模态数据特征差距的处理和互补特征的提取,是多模态识别最具有挑战的任务。最近各大相机软件变妆、换脸等功能受到广大用户的青睐,与
得益于现代科技和人工智能的发展,机器人技术替代传统生产力已成为一大研究趋势,人工智能背景下的同步定位与建图(SLAM,Simultaneous Localization and Mapping)算法便是顺应时代潮流和需求的产物。在当今社会中,SLAM算法已经广泛应用于人类的生活中,带来了极大的便捷。如:水下探测、无人驾驶以及自动导引车等。SLAM算法的结构主要分为前端和后端两大部分,前端主要借助深
近些年,随着各种通信技术的快速发展,整个社会的信息共享越来越广泛,在人们享受交互信息的便利时,网络或终端中的海量信息也需要处理,这对集成电路即微芯片的信息处理能力提出了更高的要求。集成电路的集成度很大程度上决定了其信息处理能力,而传统的电子集成电路集成度已经达到纳米量级,使其很难突破固有的物理极限和技术瓶颈,进一步提高集成度。并且电子集成电路有很多不可忽略的缺点,如:传输速度慢、抗干扰能力差、频带
学位
人们总说儿童的声音是世界上最纯净的声音,儿童清澈、干净的声音无异于天籁,合唱则能让孩子们天籁般的声音更好的呈现。合唱能够最直接地表达音乐作品中的思想感情,激发听众的情感共鸣。童声合唱不仅仅能培养孩子学会用正确的方式发声歌唱还能促进学生在认知、情感、技能和人际发展目标上的发展。童声合唱由尚未变声的少年儿童组成,即包括小学男女同学组织的合唱及初中低年级尚未变声或变声初期的男女同学共同组成。这种合唱形式
本文主要是对西方社会工作与我国社会工作的发展过程进行梳理,从社会工作的区隔、互动与融合入手,采用文献研究法、历史分析法、比较分析法以及访谈法等研究方法,对相关资料进行归纳整合。早期西方社会工作的资料我们可以发现其几乎没有自己的理论基础或知识体系,芮奇蒙德《社会诊断》一书提出要以科学的方法进行诊断以做到科学助人,推动了社会工作的专业化发展。西方社会工作理论从无到外借与实现多元化发展,有一个不得不提的
发展和完善社会主义协商民主是当代中国民主政治建设的核心。习近平总书记回顾和总结过去中国民主政治建设的工作,面对国内发展新形势,分析新时代中国国情与世情深刻变化,基于此,指出“社会主义协商民主是中国社会主义民主政治的特有形式和独特优势”(1),推动社会主义协商民主广泛多层制度化发展,建立深层次、多领域的协商,是切实保障人民权益的民主政治发展要求。党中央高度重视社会主义协商民主的发展,它是党的群众路线
回顾中国共产党百年的艰苦奋斗历程,调查研究在中国历史发展进程中每一重大历史关头,都发挥了重大作用。历史上中央的每次重大历史决策都是建立在调查研究的基础之上,可以说没有坚持实事求是的调查研究,我们就不可能取得全国革命的胜利,更没有中国建设、改革、发展的一次次突破与超越。正是依靠调查研究,运用调查研究,中国革命胜利与改革发展才不断成为现实。由此,调查研究成为中国共产党的“传家宝”。党的历代领导人始终高
图像分割是将图像分割成各具特性的区域,并将目标区域从中提取的过程。同时图像分割也是后续图像处理的关键步骤,是实现图像理解和高级应用的基础。图像分割技术经过不断发展已经应用到各个领域,如:生物医学,军事公安,工业工程等,并都取得了不错的效果。在图像分割领域中,由于图与图像之间有很好的一一对映关系,将图像的分割问题转为图的分割问题,利用图论的理论知识来进行图像分割,既避免了由于图像离散化所造成的误差,
孟子的伦理思想在其整个思想体系中占有重要地位,本文主要从仁义的角度出发,以“由仁义行”思想为核心,对孟子的伦理思想进行梳理。“由仁义行”思想以“仁义”为核心,以四端和性善说为根据,以存养和反身为内求修养路径,强调个体内在德性的培养,追求塑造健全的人格,注重德行以道德主体的德性为内在出发点,实现道德行为的主动性和自觉性。论文的具体研究从以下四个方面展开:第一部分阐述孟子“由仁义行”伦理思想的基本内涵