基于深度学习的小学英语试卷手写体识别研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:w119634336
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的不断发展,智能批阅系统走进了人们的教学生活。深度学习图像处理技术在手写体字符识别中取得了突破性的进展,因此采用深度学习技术对学生的作业、试卷进行自动识别批阅具有重要的意义。本文研究的应用场景为小学生试卷。在试卷采集过程中,由于人工扫描的过程中可能不规范操作导致了图像倾斜和不清晰,进而影响手写字符识别。再者试卷文本字迹模糊,学生手写体答案与印刷体题目重合等情况也会影响手写字符识别。传统文本定位方法例如试卷的底层特征提取和连通域结构的应用,其存在着大量的重叠与漏定的情况,不能够满足实际定位的需求。学生的手写体答案字形各异且笔画错杂,无法通过单个字符的切分来完成识别任务。因此针对以上问题,本文的主要工作如下:(1)本文先对试卷文本进行二值化,倾斜矫正和模板匹配等预处理工作来提高试卷的清晰度。利用SIFT算法进行试卷图像与模板的特征配准,再根据逻辑运算将手写体与印刷体分离,从而得到后续定位所需要的手写体样本。(2)本文基于场景文本实例分割网络DBNet,在网络中加入CBAM(Convolutional Block Attention Module)注意力机制从而提高了手写文本检测网络的性能。本文算法采用ResNet-18和ResNet-50为基础骨干网络来进行试卷数据集手写文本检测实验,最终ResNet-18在数据集上的文本检测准确率、召回率和F值分别为82%、93.1%和87.2%。ResNet-50在数据集上的准确率、召回率和F值分别为88%、91.6%和90.0%。(3)本文设计了一种基于CRNN改进的端到端识别网络模型。其针对学生手写体的不规则,在网络中加入了空间转换网络层(Spatial Transformer Networks,STN)对不规则手写体进行几何变换矫正。然后通过卷积神经网络提取文字图像特征序列,再者利用多层Bi LSTM网络来学习特征序列的上下文信息,最后结合En CTC损失函数来进行转录解码完成学生手写字符识别。在IAM英文手写体公开集和学生真实手写集上的识别率分别为82.8%和97.49%,与原算法相比分别提高了5.1%和2.68%。
其他文献
学位
“阿数瑟”是镇康各族人民在生存空间内对历史、时事、民族文化、生活故事等的活态传承与情感表达。在镇康,自古就流传着“不唱‘阿数瑟’不成欢,不唱‘阿数瑟’不成婚”的俗语。千百年过去,镇康人民仍旧践行着这一传统。由此可见,“阿数瑟”音乐文化对当地人民具有特殊意义。它是当地婚俗仪程中的一个重要外在表现,以打歌的形式传达了婚俗仪式的内在意图。笔者通过对镇康及周边“阿数瑟”音乐的考察,将镇康勐捧镇和永德塘尚林
网络流量分类是网络分析中的一个分支,它对提高服务质量和管理网络资源等起着重要作用。随着网络技术与互联网服务的发展,网络视频服务持续增长。为了更好地区分不同质量的视频服务和管理网络资源,对视频业务进行细粒度分类变得越来越重要。它能够帮助网络服务商提高服务质量(Qo S),从而能够改善用户体验(Qo E)。本文提出了一种特征信息扩展方法,并将得到的双向特征信息和交叉特征信息转化为图片,应用卷积神经网络
严格反馈非线性系统常见于民用与国防建设中,例如机械手、飞行器、船舶等,对此类系统的智能控制具有重要研究意义。基于神经网络的自适应控制方法常被用于严格反馈非线性系统的控制中,但是传统神经网络控制方法存在着瞬态控制性能较差、学习参数数量较多等问题。本文主要针对此类问题,结合预估器、最少学习参数等技术构建了一套基于预估器的神经网络自适应动态面控制策略,按照从单个系统到多智能体系统脉络,分别考虑严格反馈非
“内卷”作为2020年的网络热词,表现了当代年轻人在竞争愈发激烈的环境中不断激发自我而带来越来越多压力的循环状态。在这种氛围下,“丧”文化已然成为一种当代青年亚文化,焦虑、虚无是年轻人们的普遍心态。毕业作品纪录片《小翅膀》中的主人公便是具有这种气质的一位代表人物。《小翅膀》一片以一位大学毕业之后在农村老家做直播的同性恋男生为主要拍摄对象,展示了他在家工作和生活的状态,展现了一个特立独行却也有着平凡
中共中央国务院《关于实施乡村振兴战略的意见》中指出要高度重视发展农村义务教育,优先发展农村教育事业,建好建强乡村教师队伍,推动基础教育的均衡发展。《全国深化新时代教师队伍建设改革意见》和《教师教育振兴行动计划(2018—2022年)》中指出,要积极促进中小学教师专业发展,尤其是提升农村中小学教师的师德与专业能力,推进我国农村教育水平的提升。农村音乐教师是农村教师的重要组成,是提升农村音乐教育质量的
电影作为视听艺术,声音与画面是主要的叙事媒介。在叙事过程中,根据影片要表达的主题、内容等的不同,有时以画面为叙事主体,有时又以声音为叙事主体,影视画面与声音相互作用,产生神奇的“声画反应”,共同完成叙事。其中,声音叙事有不可替代的作用和优势,甚至在没有画面的时候独自完成叙事。目前,在探讨影视叙事的论文中,探究视觉元素叙事手法的论文居多,对影视声音叙事的相关研究占少数。本文主要从影视叙事的角度出发,
随着人工智能和计算机视觉技术的快速发展,人体行为分析作为重要的研究方向,在诸多场景中得到了广泛的应用。其中,人体跌倒行为分析能够有效监测老人或者儿童跌倒事件,通过及时预警救助避免造成更大伤害,已经引起了业界广泛关注。本文立足于家居场景,对基于机器学习的人体跌倒行为分析技术进行研究,主要工作内容如下:(1)研究了人体跌倒行为分析相关算法。首先介绍了前景目标提取算法;然后研究了人体跌倒特征提取方法;最
研究旨在介绍饲料品质提升的生产管理经验及质量管理的关键点。针对决定饲料品质的新鲜度、清洁度、细粉度、均匀度、熟化度、酥软度、酸碱度和变异度等"八度"指标提出相应的管理思路和执行标准。通过对"八度"中各关键点的把控,可以有效提高管理效率,更好地提升产品品质。
纳西族是一个拥有璀璨文化的民族,其音乐文化独树一帜。倘若把纳西族的音乐比作是一棵树,民歌“谷气”就应该是这棵树的根茎。“谷气”历史悠久、寓意悠长,是纳西族地区流传最广、脍炙人口的民歌,更是纳西族音乐文化的源流和民间口述文学的重要载体。本文通过对纳西族族源追溯、民歌“谷气”的种类以及与其他民歌的对比等几个方面的内容,将民歌“谷气”的音乐风格特征进行了深入浅出的分析,并且利用田野调查收集来的一手资料,