自然场景下的文本检测算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:qukangmin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本信息是图像中的重要线索,检测图像中的文本是智能信息处理的重要课题之一。传统的文本检测任务通常是用来提取文档图像中的文字。因为文档的背景一般比较干净、没有复杂的纹理信息,文本信息提取往往比较简单,然而在自然场景下,文本提取的难度往往远大于此,一个原因是它的背景非常丰富,例如街道、植被、楼宇等,另外文字的展现形式也是各种各样,艺术字、变形字、多语言混合、残缺字、光影遮蔽等,而且自然场景图片的质量往往不如传统文档图片的质量,正是这些原因造成了自然场景下的文本检测的效果还不尽人意。论文研究内容主要包括以下两点:1.针对文本检测的准确性问题,论文研究了一种基于CTPN(Connectionist Text Proposal Network)的倾斜文本检测算法,论文改进了CTPN网络的文本框拟合方式以及文本框分组策略,并在CTPN网络后面串联CRNN(Convolutional Recurent Neural Network)文本识别网络剔除错检结果,使其能够精确检测自然场景中的倾斜文本。改进后的CTPN算法可以准确框选出自然场景下的倾斜文本区域,在MSRATD500数据集上的测试准确率达到0.84。2.针对文本检测的快速性问题,论文研究了一种基于YOLOv3-tiny的水平文本检测算法,论文在通用目标检测框架YOLOv3-tiny的基础上,通过改进Anchor Box纵横比以及改变卷积核大小,将YOLOv3-tiny迁移到文本检测任务中,使其能够快速检测自然场景中的倾斜文本。改进后的YOLOv3-tiny更适合于文本检测任务,最后在ICDAR2013数据集上的测试准确率为0.532,该算法与其他算法相比准确率不具有优势,但是它有着极快的检测速度,在CPU上检测速度为30fps,并且该算法更加轻量级,可以部署到移动设备上,论文最终将此算法移植到Android移动端设备成功运行。论文中研究的两个算法侧重点不同,基于CTPN的倾斜文本检测算法更加准确但是运算速度较慢;基于YOLOv3-tiny的水平文本检测算法虽然精度不高,但是检测速度很快,现实中可以根据应用场景选择不同的解决方案。
其他文献
造价管理是电网工程建设管理中的重要内容,主要负责各类资产的估概算、预算、结算等工作。造价管理的业务过程较为复杂,且由于电网工程的投资规模大、物资计划复杂、施工周期长等特点,对于造价管理工作带来了较大的压力。针对目前缺乏造价管理业务软件的情况,四川省网组织实施了电网工程造价管理系统项目,通过系统的应用来提高公司的电网工程造价管理业务效率。本文对该系统的设计和实现工作进行了详细的研究和分析,基于近年来
本文提出构建一个适用于各大科研院和科研机构使用的科研管理系统,实现目标在于为科研管理人员和科研人员提供信息化且智能化处理科研项目和科研论文的平台。该系统开发基于Java EE框架开发,将系统划分为业务逻辑、数据库层以及界面层三部分,客户通过浏览器界面访问系统,使用My SQL数据库存储系统数据信息针对当前的科研管理系统存在的缺乏交互性等问题,能提出好的解决方案。然后针对复杂的角色权限控制,能够梳理
某型无人机是一种中空、长航时多用途无人机,其配套的一线维护设备——综合维护检测设备在无人机放飞前、飞行后地面检查及日常维护中使用非常频繁,综合维护检测设备用以测试无人机飞管系统、机电系统等,功能种类多。综合维护检测设备的生产调试、验收测试、故障排查目前测试方法过程繁琐且与科研工作产生较大冲突,但通用的测试方法无法满足综合维护检测设备的测试需求。因此,决定开展综合维护检测设备专测台的研究。本论文描述
肺癌是当今世界上死亡人数最多的癌症,由于多数患者发现时已经是中晚期,后续生存率不高。如果能够早期做出有效诊断并加以积极治疗,5年内的生存率可提高到54.4%。所以,提高生存率的主要举措就是早发现早治疗。肺癌早期的临床症状不明显,肺部病灶以肺结节的形式出现,CT影像成为医生诊断肺结节的主要工具。与X光胸片相比,CT检查可以获得肺部更多的细节图像,与此同时也给医生带来了很大的工作负担。为了能尽早发现肺
近年来,互联网资讯内容成爆炸式涌向人们的日常生活,各种平台、服务夜以继日地生产着资讯内容,行业对于互联网资讯的可溯源性需求也逐步转变为信息追溯的安全、可靠和高效性。同样的,互联网海量的信息当中又有相当一部分内容是相似的甚至是重复,归根结底还是因为如今互联网平台繁多,各自之间又数据不通,形成数据孤岛,造成了大量的资源浪费。总的来说就是互联网资讯领域缺乏统一的规范化管理,所以本论文旨在通过研究一套新的
如今,随着智能车辆的增多,城市车联网的规模越来越大,这使得车辆在行驶过程中,能够为驾驶员和乘客提供随时随地的信息访问。与此同时,网络中的通信用户对城市车联网安全的要求越来越高。由于车联网中车辆节点移动的随机性,网络拓扑的时变性以及通信环境的复杂性,城市车联网面临众多安全问题,主要存在的问题有以下两点。一是在存在多种网络攻击的情况下,难以保证车辆节点身份识别的准确性;二是车联网在向用户提供云计算服务
随着我国改革开放事业的深化发展,我国的工业化成果硕果累累,各种高端装备不断推陈出新,装备的性能指标不断提高,国产化率不断提升。近年来,在信息技术领域,国产的软硬件项目百花齐放,取得了很大的进步。但是,我国在高端芯片和基础软件领域仍然和国外存在不小的差距,甚至受制于人。尤其是近两年美国对我国发起贸易战,限制我国的企业、高校和其他科研单位的发展,带来了巨大的经济损失。在这个背景下,国内科研院所和科技企
区块链技术近几年发展迅速,早期的区块链应用都是公有链,承载了大量可自由出入的节点,系统一般采用工作量证明等共识算法。采用证明类共识算法的系统一般每秒可处理交易数很低以及交易确认延迟很高,难以适应于需要高并发、低延迟的金融类区块链应用。另一方面,在以比特币为代表的公有链系统中,为了提高共识节点挖矿的动力,系统会给予挖到新区块的共识节点经济奖励,这样有利于区块链的不断延伸。经济奖励直接影响共识节点挖矿
随着无人机应用领域越来越广泛,国产无人机产品的更新迭代速度也越来越快,导致其研制周期时间越来越短,而在整个研制周期中软件测试阶段所占的比重日益增大。其中,配置项测试是非常关键和耗时的一环,如果能有效地减少该项的测试时间,对于缩短整个产品的研制周期有很大帮助。本课题的主要目的是设计和实现无人机飞控软件配置项测试软件。本文首先对于国内外飞控软件测试方式进行了研究,介绍了软件开发中使用到的Eclipse
随着智能交通的不断发展,车载自组织网络在提高道路安全、实时数据收集、自动化控制、智能收费、增强导航以及一些特定的位置服务、音视频传输、娱乐服务、车内办公等各方各面都发挥着至关重要的作用。然而由于车辆的快速移动性,车载自组织网络的拓扑和网络情况会时刻发生改变,导致其路由存在两个方面的问题:一是在单播路由情况下,车载自组织网络的动态变化性易导致网络环境复杂,消息传输时延增加,同时车辆的快速移动性会造成