论文部分内容阅读
光学字符识别是实现人工智能及其关键的技术,在制造行业中的应用也越来越广泛,现有字符识别算法不能够准确高效的实现识别,需要对识别算法进一步深化研究,提高字符准确率,加快工业生产的自动化进程。本文通过文献研究、对比分析以及实验仿真的方法,以复杂的工业环境中的字符图片为研究对象,对图像识别深化研究,提出了基于边缘检测的字符区域定位、行列扫描的字符分割和基于Zernike矩的字符识别方法,并且通过实验验证本文所提出的方法的有效性和实用性。本论文完成的主要内容有:基于边缘检测的字符区域定位与字符分割。首先对待识别的字符图像区域定位,对采集的图像灰度化和高斯滤波处理,削弱噪声带来的影响,对处理后的图像用改进的蚁群算法边缘检测,同时对边缘检测中蚁群算法容易出现局部最优,效率低等问题进行相应的优化研究。在边缘检测中,将图像灰度化梯度作为蚁群转移概率的权重系数,引导蚂蚁选择边缘点,避免蚁群算法陷入局部最优的问题,同时在信息素更新中引入自定义阈值,能够使蚂蚁更快的聚集到边缘部分,提高边缘检测效果。之后在图像边缘检测信息的基础上实现区域定位,对定位后的字符用行列扫描法和字符先验条件进行字符分割。基于Zernike矩字符识别。对分割后字符二值化处理,将字符Zernike矩模值作为特征向量,同时对用Zernike矩对字符图像边缘影响较大的弱点,对Zernike矩优化研究,在提出的外圆映射法基础上,改进不变距计算框架;对由于Zernike采样量化的特性,对Zernike矩进行归一化的处理,后用欧式距离与字符库模板字符匹配,输出字符识别结果。本文最后为了验证算法的有效性,选用集装箱图片为代表,对箱号字符识别。将算法应用于现场系统中,对采集图片进行箱号识别验证。实验结果显示,箱号识别率达到96%。表明本文算法能够准确、高效对制造业环境下字符进行识别,加快工业自动化进程的建设。