论文部分内容阅读
随着数据量的增长和计算机计算能力的飞速提高,传统的人工抄表方式的弊端日益明显。现有的水表读数识别技术大多是利用浅层学习模型,但其对于复杂数据集的泛化能力会受到限制,对于样本特征的选择需要根据先验知识,操作相对难度较大。针对以上问题,在深度学习背景下,以卷积神经网络理论和支持向量机为指导,以算法的均方根误差、错误分类率、查准率、查全率以及网络训练所需时间为评价指标,对字轮式水表图像读数的识别结果进行对比分析,仿真实验表明论文算法在提高识别精度的同时降低了网络训练所需时间,证明了论文算法对字轮式水表图像字符读数识别的有效性。论文的主要贡献包含如下三个方面。第一,基于数字图像处理技术对字轮式水表图像进行预处理。针对字轮式水表图像因破损、环境以及光线等因素含有大量噪声而影响识别精度的问题,基于数字图像空域处理理论,利用平均值法对字轮式水表图像进行灰度处理,利用水平投影法和垂直投影法对字轮式水表图像进行字符感兴趣区域提取,并利用均分法进行字符感兴趣区域的单个字符分割,仿真结果表明论文算法对字轮式水表图像的一系列预处理操作是有效的,为后续对字轮式水表字符读数的识别奠定了基础。第二,基于斯坦福大学的手写字符识别的数据集理论,建立数据模型。针对样本数据规模不够的问题,基于斯坦福大学创建的手写字符识别数据集理论,将字轮式水表图像进行单个字符分割,将包含2000张字轮式水表图像的数据集扩充至包含10000张字符数据集的规模,将其中的7500张字符图像作为训练样本集,2500张字符图像作为测试样本集,仿真结果表明,论文对字轮式水表图像数据集的扩充和划分方法所得到的测试精度较高,证明其是有效的。第三,以提高字轮式水表图像字符读数识别率为目的,对CNN结构进行设计与优化。针对现有算法识别性能不够、收敛速度慢的问题,基于CNN理论,利用CNN自动提取并学习输入数据集的特征,利用SVM对字轮式水表图像进行字符识别,利用dropout函数加快网络收敛,仿真实验表明,相对于传统的浅层学习算法和经典CNN模型来说,论文的读数识别算法的精度分别提高0.89%和0.07%,网络训练时间也相对减少,证明了论文的读数识别算法是有效的。