基于深度学习的发票识别研究

来源 :南京邮电大学 | 被引量 : 2次 | 上传用户:kangzeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家经济和科学技术的飞速发展,增值税发票充分参与了社会中一系列的经济和贸易活动。针对增值税发票的处理和归档工作对于公司或者机关的会计人员都是统一的和循环往复的工作。近年来随着神经网络的发展,深度学习应用于文本识别已经成为一个非常热门的研究方向。深度学习利用快速的图像处理和特征提取技术,能够高效的定位发票图像信息区域并将其中的文字识别出来,对于降低人力、物力成本具有十分重要的意义。本文主要研究增值税发票的文本识别功能。由于受到人为或机器故障的影响,部分发票在利用扫描仪采集后都存在着字迹不清晰,文本行间距过于紧密,字符特征不明显,以及印章、噪音等情况不同程度的影响。同时,发票在采集过程中存在倾斜或者光照不均等情况。一般场景目标检测网络可以准确定位到文本的上下行,但是在密集文本中的定位,存在着定位重叠、错位的情况,这也会给文本的识别造成很大的困难。在文本识别时,传统的通用数据集不能完全贴近真实的发票文本,因此对定位的准确率也会造成干扰。针对以上问题,本文的主要研究工作如下:(1)因为发票整体版面呈现标准的表格状,所以在预处理中加入了表格框线检测并输出坐标,为后续定位工作提供预服务。本文提出一种基于计算周边矩形连接元素高度的自动估计平均字符高度的方法,该方法结合open CV中的形态学操作,可以很好的检测出发票图像的表格框线,并输出框线坐标。(2)因为大部分经过激光扫描仪录入计算机的发票图像上会出现的文本特征较差,文字字体各异、尺寸不同且行间分布的问题。本文提出了基于改进的CTPN的文本定位方法,该方法不但结合了常用损失函数中的分类和回归计算部分来判断真实文本框的概率,还利用预处理部分得到的表格框线坐标,在损失计算中加入了坐标差值置信度的考量。(3)针对通用文本数据集不真实的问题,本文采用现实场景下使用的真实发票数据集。。设计了基于Tensor Flow的发票文本识别框架,该识别框架结合卷积神经网络Dense Net对字符数据集进行训练。最后,利用识别模型对定位到的发票文字进行识别。
其他文献
目的探讨分析温胆汤加减协同治疗精神分裂症的疗效及不良反应。方法将本院精神分裂症患者随机分为观察组与对照组。观察组采用温胆汤加减协同富马酸喹硫平片治疗,对照组单用
针对汉语国际教育专业古代文学课程课时压缩、教法僵化、教材不适用、学生学习热情不高等现状,提出改革方案,认为要做好专业定位,灵活教法,提高学生兴趣。
目的:探讨冠状动脉支架植入术后患者抑郁与血浆超敏C反应蛋白和胱抑素水平的相关性。方法:根据本研究的纳入标准和排除标准,入选了2018年2月20日至2019年1月吉林大学第二医院
经济独立是很多年轻人的梦想。不少人在学生时代就开始利用假期或课余时间实习或打工,靠自己的劳动获得收入。然而,大中城市消费和房价水平居高不下,使一些已经工作的年轻人在经
报纸
本文以我国与东盟天然橡胶供需互补为模式基础,结合双方的地缘、橡胶种植、加工技术,认为构建中国-东盟天然橡胶空间产业链时机成熟。通过对模式的估计,并分析了模式的运行效
四川有悠久的酿酒历史,蜀酒文化源远流长?考古发现的四川历代与酿酒?饮酒题材相关的文物极为丰富,在各个名酒所在地发现的酿酒遗址?老窖池?各种酒文物,更是充分反映了四川名
现阶段我国制造业正面临转型升级的重要时机,智能制造正在成为新的经济发展点,云计算、物联网、人工智能等都在飞速发展,成为了很多企业争先发展的重要技术。“中国制造2025
目的探讨糖尿病患者口腔种植体周围龈沟液中趋化因子(C-C基序)配体2(CCL2)、趋化因子(C-C基序)配体4(CCL4)和趋化因子(C-X-C基序)配体8(CXCL8)的表达及其对糖尿病患者种植体
目的综合分析并科学探究腹腔镜下腹腔内补片置入治疗腹壁巨大切口疝患者的术后护理分析,为治疗腹壁巨大切口疝患者的相关疾病提供重要的数据参考。方法回顾性分析2013年10月
温胆汤首见于《千金要方》,主治"大病后虚烦不得眠,此胆寒故也"。其功效主要为温胆和胃、理气化痰。后世在此基础上进行加减,方证病机由胆气虚寒转变为胆郁痰阻,全方功效变为