面向金融业务的表单票据通用识别系统研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:x_men_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在金融业务中,存在大量如报销、核验等对表单票据进行识别的需求。传统的文字识别算法对图像质量要求很高,且识别精度较低,具有更高准确率和鲁棒性的深度学习算法成为近年来的发展趋势。目前基于深度学习的表单票据识别中尚存在若干难题:一是票据可能存在弯曲折叠的情况,导致文本行不平直,从而影响文字识别;二是财务报表中存在无边框表格,通用语义分割模型无法准确定位识别;三是印章中的弯曲文本识别存在较大困难。本文围绕上述表单票据识别中的若干难题展开研究,取得的主要研究成果如下:(1)针对表单票据存在折叠和弯曲的情况,使用改进的扭曲文档矫正模型DocUNet进行矫正。模型结构为两个U-Net级联,并在第一个U-Net中加入SE模块以增强特征提取能力。第一个U-Net预测出一个大致的复原预测图,第二个U-Net对其进行高分辨率修正,从而预测出表单中每一个像素的偏移量,实现对图像的矫正。(2)分别使用基于MobileNet-v2的Sea1SSD模型、带有注意力机制和SE模块的AttentionDB模型和ASTER模型进行印章区域定位、印章内弯曲文本检测和弯曲文本识别。通过采用复杂的特征融合机制提高分割准确率,通过提高感受野的范围增强对小文本和模糊文本的定位效果,通过基于CRF的文本矫正网络进行文字纠错。模型对印章内弯曲文本的定位精度达95.6%,文字识别精度达96.1%,接近水平文本的定位和识别精度。(3)使用带有注意力机制和SE模块的Table-UNet模型对表单中的表格进行定位提取。通过为表格内像素分配更多权重的方式,使模型更聚焦于表格区域内部。通过精心设计的后处理,将预测的表格区域分割图还原为四边形。采用同样的模型对表格线进行提取,并将卷积核设置成较大的长宽比以适应其特点。结果表明,模型在自建财务报表数据集上的识别精度达95.1%,优于PageNet、dhSegment等主流表格识别模型。(4)开发出一种基于Web的表单票据通用识别系统,可以实现对常用发票和财务报表的图像扭曲矫正、印章定位与识别、表格识别和文字识别等多种功能,系统具有较高的识别精度、较强的鲁棒性和较快的响应速度。
其他文献
畜禽养殖过程中粪污的清洁方式一直是养殖场和养殖人员最关注的问题.为了解决此类问题,本文研究设计了禽舍智能清洁自走小车,小车以电池驱动方式行驶,车身主要包括行走结构、清扫结构、无线通讯模块、温湿度传感器、有害气体传感器、光电传感器等,其中行走结构控制清洁小车在地面上往复行走,清扫结构进行粪污清扫,有害气体传感器用于采集有害气体浓度数据,红外传感器用于控制清洁小车往返,超声波传感器检测家禽位置,无线通讯模块用于远程操控和监控清洁自走小车.现场试验表明:该禽舍智能清洁自走小车可以在养殖场中正常工作运行,并可实现
随着农村经济的发展和产业种植规模的壮大,如今马铃薯产业种植发展十分迅速,规模化、标准化的种植已经成为如今农业发展的需要.农民自由种植马铃薯也逐渐朝着机械化、智能化发展.当前中国马铃薯的收获方式大多采用分段收获的方式,即马铃薯挖掘机挖出马铃薯后再人工进行分拣.本文将从马铃薯挖掘机的主体工作部位挖掘铲入手,并对国内外马铃薯挖掘机的质量状况进行分析,总结出国内目前存在的部分问题.而后浅析问题产生的原因并提出相应的建议,为国内马铃薯挖掘机的发展提供参考和借鉴.
红薯是一种高产而适应性强的粮食作物,与工农业生产和人民生活关系密切.其块根除作主粮外,也是食品加工、淀粉和酒精制造工业的重要原料,根、茎、叶又是优良的饲料.红薯作为重要的经济作物,种植过程较为繁琐,尤其是在山区种植,大型栽种机无法进入耕地,需要人工进行种植,而人工种植劳动强度大、效率低.本项目研究的红薯栽种一体机采用智能化控制系统(仅需启动开机键即可自动完成红薯苗的栽种工作,当遇见机器停止时,撒肥机器自动感应自动停止撒肥),提高了红薯栽种的效率,并且科学地控制化肥的使用量及浇水量,很大程度上提高了红薯的存
在农业发展过程中,传统耕作存在着问题,影响着农作物生长,不利于农民提升经济收入.深松作业的出现解决了传统耕作问题,它是科学的耕作土地方式,可以更好地疏松土壤,提升耕层深度,不会使土壤出现翻转.因此深松作业被农民接受,农民生产意识在提升,从而增加了采购深松机的数量.本文主要阐述了农业深松机的使用与保养措施,仅供参考.
处理器微体系结构是计算机系统的重要组成部分。芯片厂商通过先进的微体系结构设计来达到性能和功耗的领先,但往往缺乏从安全的角度对其进行审视和验证。一旦处理器微体系结构出现漏洞,将直接影响整个计算机系统。近年来,研究人员发现了大量的微体系结构漏洞,影响了大量的Intel、ARM和AMD等处理器。这说明我们的处理器面临大量安全威胁。处理器微体系结构安全已经成为一个非常重要且有意义的研究领域。本文对基于功耗
高水平的农业机械化是现代农业的标志,也是现代农业最基本、最不可替代的生产工具,更是农村经济的重要组成.因此,发展农业机械化水平成为了实施乡村振兴战略的有力措施.在农业机械化水平高速发展的同时,农机安全监理工作也面临着越来越重大的责任与挑战.农机安全监理工作直接关联着农机安全生产,就像交管部门对于交通安全一样,农机安全监理是农机安全生产最基本的保障.但是,由于各种各样的原因,目前的农机安全监理工作也面临着各种各样的问题,农机安全监理也发挥不出应有作用,针对这种情况,本文首先对农机安全监理在农业机械化进程中发
认定制动性能是衡量拖拉机安全运行的一项重要技术,但技术指标存在较大误差.故认为制动性能是衡量拖拉机安全运行的重要技术指标的方法是错误的,不能准确反映拖拉机的制动性能.同时,依据“符合GB16151.5-1996《农业机械运行安全技术条件》”来判断拖拉机、农用车等各种车辆是否属于同一标准也是研究的一大误区.1996年5月,为了确定具体符合国家标准的各种车辆的制动性能,我们发现与拖拉机等各类车辆相比,认定农用车属于同一标准,误差很大.因此,本文的研究是为了发现符合国家各类车辆标准的拖拉机制动阈值.
本文简单阐述了表面工程技术的定义、发展以及包括的工艺方法,着重介绍了电刷镀、堆焊、热喷涂等表面工程技术在农机维修上的应用.
机电一体化是结合了社会经济发展需求的科学技术,对于不同学科的知识进行了有机结合的现代化工业发展技术.在推动我国工业化生产方面有着极为重要的作用.而将机电一体化与农业进行结合,促使农业可以朝着机械化、自动化以及智能化的方向发展,对于农业的生产以及未来的发展有着重大意义.本文以农业机械机电一体化技术的运用实践为主题进行论述.
农业植保是农业生产当中最重要的环节之一,也是影响作物产量与品质的关键因素之一.传统的农作物植保方式太过粗犷,在农药的使用量节节攀升时,病虫害的抗药性也在逐渐提高,尤其是目前农业的快速发展,如不加改变,农药的使用量将会呈指数发展,届时对生态环境也将造成严重威胁.因此,传统的植保方式必须得到改变,除了优化农药及农业技术以外,植保施药的方式也必须相应做出改变.因此,本文着重探析在农机农艺深度融合的基础下,现代化植保防控的发展之路.