基于3D视觉的PCB元器件字符识别方法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:bascin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子信息技术的快速发展,印刷电路板(PCB)应用越来越广泛,为准确高效地对其进行检测,自动光学检测技术(AOI)逐渐发展起来且已被应用于实际生产。目前,AOI技术主要采用2D视觉检测方法,但是由于元器件表面字符印刷方式不同,元器件字符凹凸性不同、颜色和大小多样,2D字符识别系统的鲁棒性低,准确性不足。而PCB的3D点云(3D-PCB)数据中的高度信息能有效增强PCB的2D图像(2D-PCB)中的字符信息,提高字符与背景的对比度。为此,开发一套基于3D视觉的字符识别系统以提高AOI系统中的字符识别准确率,具有十分重要的研究意义。本文以PCB元器件字符为对象,设计了基于3D视觉的PCB元器件字符识别系统。该系统从融合2D-PCB图像与3D-PCB数据的角度出发,提出了基于数据标定和标记点的2D/3D配准与拼接方法,完成了2D-PCB图像与3D-PCB数据的融合以及3D-PCB图像的拼接。由于3D-PCB数据存在噪声波动,采集到的元器件表面不平整,针对该问题,设计了基于随机抽样一致算法(RANSAC)平面拟合的字符增强算法以利用3D信息增强2D-PCB图像中的字符。此外,提出复杂环境下的字符分割算法以更好的完成元器件字符的分割,并使用Mobile Net V3完成了字符识别。本文的主要内容如下:(1)PCB元器件字符识别系统总体方案设计。首先,对PCB元器件字符识别技术要求进行分析,完成了字符识别系统的硬件选型和布局设计。其次,为采集2D-PCB图像和3D-PCB数据,设计了采集系统的运行流程。最后,针对元器件的字符特征,初步设计了系统总体算法流程。(2)基于数据标定和标记点的2D/3D图像配准与拼接。首先,利用PCB待拼接图像中丰富的纹理信息,提出基于FAST特征与RANSAC配准方法对多张PCB局部图像进行拼接。其次,针对来源于不同传感器的2D-PCB图像和3D-PCB数据无法直接对应的问题,提出了基于数据标定的信息归一化算法,实现2D-PCB图像3D-PCB数据的粗配准。最后,提出了基于标记点的2D/3D配准与拼接算法,得到2D-PCB图像与3DPCB数据间的转换关系,完成两者的匹配对齐,进一步实现了2D-PCB图像与3D-PCB数据的精确配准,并保证3D-PCB图像中元器件及其字符的完整性。试验结果证明,所提出的配准与拼接方法能够得到完整的3D-PCB图像。(3)基于3D数据的字符定位与分割。首先,为了从大量元器件中挑选出待检元器件,利用直通滤波器去除了PCB板中无需检测的区域,生成待检元器件的掩模。其次,针对PCB元器件表面3D数据存在噪声波动,无法得到准确的投影基准的情况,提出了RANSAC平面拟合的字符图像增强算法,保证PCB元器件字符的3D数据能有效增强2D-PCB图像中的字符。针对PCB元器件受外界脏污干扰的情况,通过结合最大稳定极值区域(MSER)与形态学方法准确定位了字符区域。最后,针对元器件字符形式多样、背景复杂的问题,设计了复杂环境下的字符分割算法以完成各类PCB元器件的字符分割。试验结果表明,本文提出的字符增强算法能有效增强2D字符图像,并且本文设计的复杂环境下的字符分割算法能准确分割出PCB元器件字符。(4)基于MobileNetV3的PCB元器件字符识别。针对分割图像出现干扰信息的情况,利用连通域分析的方法去除了干扰信息,筛选出干净的PCB元器件字符分割图像以提高字符识别率。此外,构建PCB元器件字符的专属数据集,并使用训练集训练了Mobile Net V3神经网络,使用更新后的网络参数完成了PCB元器件字符识别。与支持向量机(SVM)的对比试验证明,在使用相同测试集的情况下,基于Mobile Net V3的PCB元器件字符识别方法网络能够更准确快速的识别PCB元器件字符。综上所述,本文根据PCB元器件字符识别的技术要求,搭建出PCB元器件字符采集的硬件系统,包含2D采集模块和3D采集模块。设计了基于3D视觉的字符识别算法,并基于Visual Studio、QT的软件平台和模块化的思想,开发出基于3D视觉的PCB元器件字符识别软件系统,主要包含用户登录模块、字符识别模块、数据管理模块和训练集构建模块。现场试验证明,本文设计的字符识别系统的平均准确率为98.28%,基本满足PCB元器件字符识别的技术要求。
其他文献
近年来,车外抛物问题越来越受到社会各界的关注。车外抛物这种不文明现象给交警部门以及市政部门及时清扫带来巨大挑战。如何有效地解决车外抛物问题已成为交警和市政部门亟待解决的问题。尽管深度学习的研究已经取得了很大的成就,并已广泛应用于各种场景(如:车牌识别和交通流量预测),但仍有许多问题尚未完全解决。例如,如何及时有效地检测出交通领域内车外抛物的问题仍然是一个亟待解决的问题。一般来说,传统的方法(如:支
互联网上产生大量的非结构化文本数据,如何有效的从这些非结构化的文本数据中挖掘并抽取实体和关系信息就要涉及到实体关系抽取研究;这对知识图谱和自动问答等下游应用的构建具有较强的理论意义和实用价值。本文主要以Transformer特征提取模型为基础,通过对现有实体关系抽取模型的改进,提高实体关系抽取的性能。主要研究内容如下:(1)针对Transformer模型在实体关系抽取任务中性能不佳的问题,本文抛弃
行人检测是计算机视觉领域的重点研究课题,在智能交通和自动驾驶领域有着广泛的应用。近年来,基于多光谱图像的行人检测方法由于结合了可见光图像和红外图像的信息,在全时段的检测环境中具有明显优势,已成为当前的研究热点。但由于交通道路场景的复杂多变,多光谱行人检测算法仍会受到光照和温度等环境条件变化的影响,要满足自动驾驶实际应用的准确率需求仍存在一定困难。本文针对多光谱行人特征的表达方式和融合方法进行研究,
车联网(Internet of Vehicles,Io V)使得车辆间能够通过无线通信交换感知到的道路状况以及车辆运动状态等信息,并根据接收到的信息及时做出反应来减少交通事故、缓解交通拥堵以及节省能耗。然而,由于车辆在复杂多变的环境中高速运动,车辆运动状态时常发生变化,网络拓扑变化频繁,导致网络时延、数据传递率等通信性能实时变化。一旦车联网通信性能无法满足基本的通信需求,车辆无法及时地收到安全信息
图像语义分割作为基础的计算机视觉处理任务,其本质上是利用对像素点的分类把图像划分为若干个不同且有意义的区域。从宏观上来看,语义分割是场景理解的必要步骤,是将图像由具体变为抽象的过程。随着计算机视觉的发展,语义分割在自动驾驶、医疗诊断、遥感图像分析等领域中具有非常重要的应用价值。近年来,基于全卷积神经网络的语义分割方法作为一个较新的研究方向受到了广泛的关注。在无数研究人员的共同努力下,基于深度学习的
光场图像新视点生成是与光场图像重定向密切相关的科学问题。现有的新视点生成算法多针对光场内插,生成视点范围受限,且无法修改光场图像的基线(baseline),同时当进行视点外插时,产生的空洞问题仍没有一个合理的解决办法。“先拍照,后对焦”是光场图像的一大特点,光场图像重聚焦是光场图像增强算法中的热点问题。但传统重聚焦算法存在混叠现象,严重损害了重聚焦图像的视觉效果。据此,本文提出了一种光场图像基线编
特征选择在模式识别、文本分类和计算机视觉等数据维数通常很高的应用中具有重要意义,它可以降低计算复杂度,发现高维数据的内在流形结构。本文研究矩阵回归模型及相应的特征选择方法,主要内容包括:首先,给出了鲁棒图正则化稀疏矩阵回归(RGRSMR)模型,其损失函数是基于L2,1范数,并以基于流形学习的类内紧致图作为正则化项。RGRSMR将类内紧致图与稀疏矩阵回归结合在一起,以执行二维矩阵数据的特征选择。其次
基于现有VR技术的相关应用,探索如何利用VR技术实现对孙温《红楼梦》绢本画的数字化设计。主要寻找传统文化内容与虚拟现实技术的交叉点,并利用VR技术实现对孙温《红楼梦》绢本画的交互性展示,为用户带来兼具沉浸性与真实感的虚拟体验。在设计过程中以孙温《红楼梦》绢本画的多形态交互性展示即VR系统中界面功能设计为突破口,使其审美性与交互性在虚拟体验之中结合形成文化内涵的跨媒介传播与表达。提高《红楼梦》相关文
随着图形化信息技术的生活化渗透与大众常态化文娱需求的日渐提升,视觉文化迅速发展成为人们精神生活和文化生活的主要感知感受方式,公众的艺术审美能力和视觉美学鉴赏力普遍提升,视觉价值标准与审美需要也在不断被重塑。但是从当前传统剪纸文化的传承发展现状而言,其视觉构成上的转化完成度以及视觉文化信息的活态体验呈现远远不能满足用户的使用、审美以及情感诉求。传统文化视觉构建惯式大多仍停留在对传统文化内容元素的跟踪
图像融合的基本思想是利用特定算法将多种传感器对同一场景获取的图像提取不同信道的有用信息,最后融合成高质量的图像,以提高图像的利用率、可信度和准确性,在军事监测、医疗诊断和目标识别等领域广泛应用。在过去的几十年中,许多传统的图像融合方法被提出,这些图像融合算法大致可以分为两类,即空间域算法和变换域算法。空间域算法首先根据某种策略将源图像划分为若干个图像块,然后对每对图像块根据计算活动度量融合在一起。