非均匀光照文本图像二值化与OCR预处理优化算法研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:casterisme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从古至今,文字是人类记录各种信息的核心载体,也是人与人交流的主要媒介,在如今的人工智能时代,为了有效发挥计算设备在信息录入、拍照翻译以及资料检索等辅助任务上的优势,对光学字符识别(Optical Character Recognition,OCR)技术的研究一直备受关注。通常地,对文本图像进行二值化(Document Image Binarization,DIB)是识别文本的预处理步骤,然而,由于非均匀光照、反射光以及伪影等自然场景下常见问题的干扰,导致现有DIB算法的二值化结果不够理想,严重影响后续文字检测与识别的性能。本文针对手机摄像头所获取的非均匀光照文本图像(校友墙)进行二值化处理,通过对现有DIB算法的复现发现,其结果存在明显的噪声点、文字背景与前景相互混淆以及亮暗文字同时出现时结果混乱等问题。因此,本文提出了一种基于边缘引导聚类的二值化方法,在有效降噪同时保证了文字完整性。此外,课题中进一步利用百度Paddle OCR识别上述校友墙,墙中的文本以中文姓名为主,同时包含年级和专业等标注内容,由于该工具不能精确定位和区分姓名与其它文字,导致识别结果出现文字混淆,为此,本文提出了一种反馈优化和文字区域优化策略,能够进一步提升Paddle OCR在姓名识别上的准确率。本文的主要工作与创新点如下:1.对非均匀光照条件下的文本图像进行二值化。我们将文本图像划分为等大小的小区域,通过边缘检测算法计算边缘图,以边缘点最多的原则选取初始二值化区域。在二值化过程中,以初始区域为中心,提出逐步将小区域划分为包含文字的区域或者背景的算法,利用K-means聚类算法对文本区域的像素点进行分类和标注。为了提高二值化速度,我们借助包含文字的区域中已知的两个聚类中心,来初始化当前区域的K-means聚类器。针对较暗和较亮文本同时出现的情况,我们提出标签翻转算法对误标注的文字背景像素点进行纠正,将二值化结果转换为白纸黑字的样式。对从DIBCO数据集中的挑选的九张非均匀光照图片进行实验,我们提出的算法在没有进行后续优化处理的情况下,各项指标在六个具有代表性的算法中综合排名第三。在实景拍摄的非均匀光照图片中,从直观角度看,二值化效果明显优于其他六种方法,且文字的完整性较高。2.提出文字检测区域优化算法,提升实景拍摄的校友墙图片中名字识别的准确率。我们分割出误检测区域,计算其边缘图,根据文字区域大小,提出自适应卷积核Ks计算方法,经膨胀操作将文字左右相连,提出名字分割算法分割图片中的文字区域。单个文字的区域进行匹配连接,最终得到基于区域优化算法的文字识别流程。在我们拍摄的自然场景下的文本视频中,每隔40帧选取一张图片,对比使用区域优化算法前后的文字区域检测和文字识别效果,结果证明效果有明显的提升。
其他文献
在当前的小学数学教学中,思维拓展逐渐成为一个重要主题。而深度学习作为当前最重要的教育理念之一,无疑对学生的思维拓展具有重要的指导意义。因此,笔者通过直接观察与文献分析相结合的方式,对“深度学习视域下的小学数学教学”进行了一定的研究。在本文中,笔者结合研究当中产生的认识,分析了小学数学思维拓展现状以及小学数学深度学习的特征,思考了怎样在深度学习视域下引导学生进行思维拓展。
建设儿童友好城市,寄托着人民对美好生活的向往,事关广大儿童成长发展和美好未来。在“新城发力”的背景下,基于上海松江新城试点实践,分析目前在儿童成长空间友好型社区营建方面存在的不足,诸如实施目标和措施距离卓越全球城市的差距较大、城市规划管理缺少相关技术标准和指引、儿童优先和儿童视角下的城市环境有待加强等问题。进而通过借鉴荷兰鹿特丹、日本流山市和我国深圳景龙社区等案例,对松江的儿童友好新城规划建设提出
<正>晋文旅发〔2022〕24号各市文旅局、各有关单位:为贯彻落实《中共中央办公厅国务院办公厅关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》《国务院办公厅关于规范校外培训机构发展的意见》,加强对全省文化艺术类校外培训机构的监管,山西省文化和旅游厅制定了《校外文化艺术培训机构准入指引(试行)》,现印发给你们。请各市文旅局根据实际情况,遵照文化和旅游部《关于做好文化艺术类校外培训管理相关
期刊
大多数先进的基于深度学习的图像分割算法缺乏结合图像上下文关系的能力,忽略了上下文信息对分割轮廓的作用及影响,使得算法性能的提升有所局限,为此本文提出了一种基于轮廓的图像分割方法,它利用一种渐进式动态图网络进行轮廓的变形。具体地,本文根据目标轮廓的拓扑结构,在轮廓上采样顶点将其转变成一个动态图,通过扩散目标点的上下文信息进行推理学习,并积累历史的学习经验来进行轮廓图的动态更新,本文通过一种端到端的方
近本文研究了截断随机变量和k-正态分布.利用对数凹函数理论,获得了涉及截断随机变量和截断随机变量的函数的方差的不等式链,推广了涉及正态分布和分层教学模型的一些经典结论.同时在附录部分给出了仿真结果.
催化剂在推动聚烯烃工业发展中有着举足轻重的作用,其中金属催化剂的设计与合成更是金属有机催化化学的关键. 稀土金属具有独特的轨道结构、反应活性和配位准则,因此稀土金属配合物通过在金属中心周围引入空间位阻,在聚烯烃材料制备中表现出独特优势. 其中配体是决定稀土金属配合物的结构、化学活性及稳定性等方面的关键因素. 本综述介绍了茂基配体(烷基取代、芳基取代、茚和芴配体)和非茂基配体(大环四齿配体,三齿配体
<正>2月18日,上海市委书记李强赴奉贤新城调研,指出:"‘五个新城’建设势在必行、正当其时。要围绕独立的综合性节点城市定位,对标一流,谋定快动,回答好新城"新"在哪里这个实践命题。""五个新城"(嘉定、青浦、松江、奉贤、南汇)建设是上海"十四五"规划的重要内容,"十四五"期间,"五个新城"将集中发力、全面赋能,在主城区外围打造上海都市圈第一圈层,从长三角城市网络中脱颖而出。
期刊
<正>一、研究背景据相关报告显示,我国目前是全世界盲人人数最多的国家,约占世界盲人总数的18%,所以导盲问题也成为我国在盲人领域所面临的主要问题之一。目前解决盲人出行问题的主要方法有两种,一种是当前最安全、可靠的就是"导盲犬出行"。但众所周知目前导盲犬的数目和盲人数完全不对等,每100个盲人中只有一人可以拥有导盲犬。同时购买一只导盲犬的费用对于普通盲人家庭来说也是一笔不小的开支,而且在大多数的公
期刊
本文通过对课例的研讨,阐述了"小学语文课堂教学中探究"的不同观点。