手机拍照下基础算式自动识别

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zhy724458069
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,互联网教育行业发展迅速,人们对于互联网教学过程中出现的数学算式有自动识别和自动批改的需求。对这类基础算式进行自动识别和批改,需要对图片中的算式进行定位、分割、识别,最终转换为文本数据输入到计算机系统当中进行自动批改。但是由于教学阶段的基础算式识别具有一定的特殊性,尤其是小学阶段的通用竖式在定位和分割过程上具有一定复杂性。检测和识别基础竖式具有特殊性和一定难度,不能简单的用识别常规传统文本的方式来实现定位和识别。因此,研究并实现一个手机拍照基础下的基础算式识别系统是十分有意义的。本文对基础算式识别系统中的涉及到的算式定位与识别技术进行了深入的研究,利用深度学习网络模型定位识别基础算式。以此为研究基础,本文设计并实现了一个手机拍照下的基础算式识别批改系统,为互联网线上教学提供了一种可行高效的小学基础算式教学批改方案,帮助师生进行线上学习。本文的主要工作内容如下:(1)本文针对小学阶段基础算式识别和批改的实际应用场景,采集了1500张手机拍照下的包含基础算式的图片作为数据集,这些图片共包含10254个基础算式,算式字体、结构、排版具备多样性。本文对基础算式数据集进行了标注,标注信息包括算式定位框、算式识别内容和计算结果。(2)本文结合当前深度学习理论,根据手机拍照场景下基础算式识别的相关需求,对CTPN文本识别模型进行了针对性的改进,并以此为基础提出了基础算式检测定位模型。该模型对基础算式文本行区域的检测定位性能明显优于其他深度学习网络模型。针对小学阶段的基础竖式,本文通过聚类连接的方法对竖式文本行进行上下文的连接,准确识别出基础竖式的计算过程并进行批改。(3)本文基于基础算式检测识别的研究,应用Java Spring框架和Python语言实现了一个基于基础算式检测定位模型和开源识别引擎Tesseract的手机拍照下基础算式自动识别系统。系统共有五个主要的功能模块图像预处理模块,算式定位模块,竖式连接模块,算式识别模块和结果重组模块。图像预处理模块主要负责图像的噪声去除,大小压缩调整和旋转校正;算式定位模块利用改进过后的CTPN模型对算式文本行进行检测定位,并对存在基础竖式的图像区域进行纵向连以接建立基础竖式识别过程中的上下文对应关系;算式识别模块利用开源识别引擎Tesseract先识别去并除非算式文本框,再对定位到的算式图像进行识别并进行批改判误;最后结果重组模块对识别结果进行重组,并把结果返回给手机移动端,由手机移动端展示给用户。
其他文献
一、作业前的检查1.检查采棉机轮胎气压,气压不足时及时充足气。2.采棉机启动前,检查发动机机油、柴油、冷却液是否满足作业要求,同时检查各传动部件间隙,若间隙不当应进行调整。
点触式采棉机是根据新疆棉花种植特点和收获要求,综合国内外机采棉技术优势研制开发的一种小型、高效棉花收获机械。该机具为自走式,每台机具由3~5人使用塑料吸花软管进行拾花作
高校中实行推优入党措施为党组织发展的重要工作内容之一,高校是国家实施教育工作的重要场所,也是为国家培养人才的主要形式之一。高校内部优秀人才云集,将其中更为优秀的人
<正>近年来我国科学技术发展取得了非凡的成就,大家纷纷投入科技研发中,珠宝界也不例外,中国珠宝行业的转型优化,智能首饰逐渐兴起,智能首饰原创设计需求与日俱增。本论文研
会议
基层税务部门党组织作为党在机关中的基本单位,是凝聚党员群众的坚强核心,是执行党的任务的战斗堡垒。然而,随着经济体制和社会结构的深刻变革,基层税务部门党组织和党员干部联系服务群众和执行党的任务的工作方式也面临新的挑战。本文针对县级税务部门基层党建工作所面临的新形势,在充分总结县级税务机关基层党建工作所取得的成果的同时,深入探究县级税务机关基层党建工作存在的困境和难题,并深入分析这些问题存在的原因,以
公路隧道作为我国交通运输的主要通道,其公路隧道的施工质量影响着我国交通运输行业经济的总体发展,并且对运输车辆和人员的安全一定的影响。因此,对于公路隧道的施工,相关监
在进行大跨度斜拉桥钢锚箱式索梁锚固结构空间非线性仿真分析时,有限元模型的正确与否至关重要。由于目前软硬件能力的限制,只能采用锚箱局部模型进行分析,而模型中选取的结构范