基于深度学习的票据识别系统设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:a316529455
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着深度学习技术的快速发展与卷积神经网络在计算机视觉研究工作中的广泛应用,图像分析与理解领域的研究工作取得了瞩目的成绩。作为图像分析与理解领域的重要分支,光学字符识别(Optical Character Recognition,OCR)技术和方法逐渐成熟,在生活中得到广泛应用,将OCR技术用于文档识别与场景文字识别的需求与日俱增,具有极大的使用价值和应用前景。票据作为人们生活中常接触到的一种纸质文档,记录着重要的消费信息,然而在票据信息审核以及财务报销等流程中,处理大量的票据是一项繁琐的工作;在金融公司信息化升级过程中,对海量纸质票据的处理归档同样是耗时耗力的工作。得益于OCR技术在文档识别领域的广泛应用,部分研究者研究利用OCR技术对票据图片进行自动化处理,定位票据图片上的文本并识别文本信息。但票据图片上的文本目标极为密集且由于印刷质量、纸张损坏、手写签字、扫描质量等因素影响,票据文本识别难度较高。另外面向个人用户的票据识别系统较少,且识别精度较低,无法满足实际应用需求。因此,研究针对票据图片的文本识别算法和建立票据文本识别系统具有十分重要的研究意义和价值。本文从构建票据文本识别系统出发,研究OCR技术在票据文本识别任务中存在的问题和技术难点,针对票据文本特点和技术难点设计文本检测与识别算法。针对分割算法在密集票据文本上存在的粘连问题,本文设计基于建模相邻文本单元间边界区域的文本检测算法,提出边界建模思路与对齐损失函数设计,解决密集文本分割区域粘连问题;引入可微分二值化模块解决分割网络训练不充分问题,提高票据文本检测精度。针对主流文字识别算法在票据数据上识别精度较低的问题,在分析票据文本特点与方法缺点的基础上,从训练方式、网络结构、后处理三个方面提出改进设计,提高票据文本识别精度,为基于深度学习的票据识别系统提供高精度、高鲁棒性的文本检测与识别算法。为了进行票据文本检测识别算法研究与方法性能验证,本文提出票据文本数据集(Bill Text Dataset,BTD)。最后,在本文设计的针对密集票据文本的检测与识别算法基础上,通过对票据识别系统的需求分析和功能分析,完成网页端基于深度学习的票据识别系统设计与构建,满足应用需求。
其他文献
富互联网应用程序是一种具有传统桌面应用程序特性及功能的Web应用程序,它不仅继承了传统Web应用易于传播的特性,还可以在客户端进行数据的收发和处理。OpenJFX是针对富互联网应用提出的一个现代高效的解决方案,提供了良好的流媒体支持和流畅的动画支持,更丰富的组件和更友好的操作界面。目前,OpenJFX仅支持x86架构和ARM架构,将OpenJFX移植到国产平台有利于丰富国产处理器的软件生态。首先,
随着计算机硬件水平的飞速提升、医疗图像的海量激增,将三维实际物景转换为适合计算机处理的二维平面图像进行处理和分析,已逐渐成为趋势。不同于传统诊断方式,计算机软件系统通过对儿童手部特征图像的识别可以完成对儿童手足口病的辅助诊断。不仅能够充分利用医疗图像、大大节约医疗资源,而且能够实现异地诊断、减轻患儿负担。本文以儿童手部特征为识别对象,利用卷积神经网络模型对儿童手部特征图像进行识别,设计实现了手足口
现代无人艇作为一种高度智能化的无人控制平台,内部控制网络和相关结构单元十分复杂。其控制系统的总线类型多样且互不兼容,加大了数据在无人艇控制系统内部传输和交互的难度,也在一定程度上限制了无人艇的发展。因此,本文在不改变无人艇现有控制网络架构的基础上,提出了一种多总线转换的方案,并基于此方案,设计并实现了无人艇多总线转换及数据监控系统。本文在对团队自主研制的xx68系列无人艇控制系统进行详细分析的基础
学位
在跨境电子商务产业链中,供应链需求预测需要预测每个商品在每个仓库未来的需求量,以便将商品提前准备在全球各个市场的仓库,可有效降低物流时间,极大提升用户体验。本文以供应链需求预测为研究对象,对多种需求预测算法进行了研究,并针对其中存在的异常点检测、商品信息的向量化表示、多步预测等不足之处提出了三个创新点进行改进,提高了需求预测的准确率。首先,在数据处理方面提出一种基于Huber Loss的线性回归方
考试是选拔人才的主要途径,它要求绝对的公平公正,而替考这一考场舞弊行为严重的损害了考试的公平性。因此,如何提高考生身份识别的准确率,保证考试的公平性,具有重大的研究价值。目前的考场签到过程中,多数考场仍然采用人工比对身份证和准考证的方式来判别考生身份,这种方式存在人工开销大、判别出错几率较大的问题。基于此,本论文通过对生物识别技术中人脸识别算法的研究,设计了一套便携式考场签到设备及系统,结合人脸识
随着生活节奏的加快与社会压力的增大,人们因饮食不规律导致患胃肠道疾病的现象愈加严重。近年来,无线胶囊内镜技术已成为检查患者胃肠道的首要选择。然而,一次无线胶囊内镜检查将产生约6万张图像,带给医生后续筛查工作沉重的负担,如何快速有效地从海量图像中识别检测出病变已成为亟待解决的重要问题。神经网络在处理图像问题上有着得天独厚的优势,基于神经网络的医学影像分析为解决这一问题带来新的契机。无线胶囊内镜图像与
随着互联网逐步深入到人们的生活,网络安全问题也影响到社会生活的方方面面,其中以木马和僵尸网络所造成的危害最大。为了躲避网络边界的检测,这类恶意软件通常使用HTTP协议作为应用层协议,把自己的流量隐藏在大量HTTP背景流量当中。传统基于流量模式匹配的检测方法,在面对这类经过伪装的恶意流量时往往无能为力,研究者们开始转向使用机器学习的方法来实施恶意流量检测。而这些方法,往往针对单个HTTP请求数据流进
近年来,随着智能手机和平板电脑广泛普及,互联网社交媒体的用户数量迅速增长,与此同时产生了海量的社交媒体数据。在这样一个信息爆炸的大数据时代,如何挖掘出海量数据背后的价值成为了众多研究者的研究方向。相较于其他数据挖掘方法而言,机器学习无疑是当前应用最广泛且最成熟的。研究人员将社交媒体和机器学习相结合,在分析公众舆论,灾害治理,市场营销等方面已经取得很大的成效。然而不可否认的是,在机器学习技术给我们带
在现实世界中,图像数据包含现实对象的海量信息,是对客观对象的描述或客观的映射。为计算机能够更好的理解现实世界,发展出来多种计算机技术,基于深度学习的语义分割方法能够较好地提取图像高层语义信息,更好地应对自然场景。深度学习语义分割算法中的特征提取部分十分重要。模型越深特征提取能力就越强,但是所得到的特征越抽象。以Deeplab语义分割框架作为基础,提出优化方法,通过对比实验结果说明优化效果的有效性。