【摘 要】
:
自然场景的文本检测是指对图像中单词或文本行的边界框进行定位的一项技术。近年来随着社会对于自然场景下文字检测的需求不断增长,场景文字检测与识别技术被广泛应用于各行各业。不过自然场景下的文字检测与识别往往有复杂的背景干扰,自然场景中的文字字体、颜色、排版和尺寸具有多样性,传统的方法很难实现文字与背景的有效分割,并且场景文字由于其多样性及与背景的近似性,使用单一的传统方法很容易导致漏检。如何有效检测到复
论文部分内容阅读
自然场景的文本检测是指对图像中单词或文本行的边界框进行定位的一项技术。近年来随着社会对于自然场景下文字检测的需求不断增长,场景文字检测与识别技术被广泛应用于各行各业。不过自然场景下的文字检测与识别往往有复杂的背景干扰,自然场景中的文字字体、颜色、排版和尺寸具有多样性,传统的方法很难实现文字与背景的有效分割,并且场景文字由于其多样性及与背景的近似性,使用单一的传统方法很容易导致漏检。如何有效检测到复杂背景下的文字并且识别不规则文字仍然是一项极具挑战性的任务。本文基于深度学习技术,针对场景文字检测与识别出现的问题提出解决方案。本文的主要工作如下:(1)提出一种基于自动生成导向包围盒模块的场景文字检测方法。该方法利用单阶段文字检测方法自动生成导向包围盒,作为第二阶段的文字检测的输入,进一步修正文字包围盒的边界,并去除错误的文字包围盒。自动生成的包围盒能更符合文字的形状,并省去预定义包围盒的参数调整。(2)提出一种基于有监督文字矫正网络的场景文字识别方法。该方法着重点在于对图片文字的矫正,能使竖直文字和不规则文字矫正为正常的水平文字。对于竖直的图片,本文设计了竖直文字矫正模块,用于将竖直文字矫正为水平文字。(3)对于矫正后的竖直图片以及其它图片,本文采用一种新颖的有监督的空间变换网络来对不规则文字进行矫正。矫正后的图片则输入到基于卷积循环神经网络的编码器中进行特征提取,最后将编码后的特征经由基于注意力机制的序列到序列模型的解码器转为最终输出。本文提出的基于自动生成导向包围盒模块的场景文字检测方法在常规自然场景文字检测中能够提高检测的精度,文字矫正网络能有效将竖直文字和不规则文字矫正为正常的水平文字,并提高了识别结果的识别率。因此,本文的研究对于提高自然场景文字检测和识别的效率,更好的服务于自然场景下文字检测需求具有重要的作用。
其他文献
随着现代无线通信技术的高速发展,新型的无线通信设备的研究趋势倾向于小型化,高集成度和高性能。天线作为无线通信系统中体积和质量较大的一个元件,却又承担着收发无线电信号的关键角色,直接影响着整个系统的工作性能和工作效率。因此,在确保无线通信设备性能的前提下,天线元件的小型化对于整个设备的小型化和便携性都有着至关重要的意义。本文的主要研究内容是解决微带天线在实现小型化时工作带宽恶化的瓶颈问题,文中从天线
全无机钙钛矿纳米晶体因其优异的光学性能和高载流子迁移率而受到广泛关注,并在太阳能电池、发光二极管(LED)和激光器中显示出强大的应用潜力。其中,新兴的Mn2+掺杂全无机钙钛
随着我国高铁蓬勃发展,我国已经拥有全世界最长运营里程及最高运营速度的铁路网络。高铁运行安全成为我国乃至全球交通领域研究重点。在车辆主动安全技术中,司机乃不可或缺一环,以此为出发点,本文结合时下新兴人工智能技术提出一种基于卷积神经网络的高铁司机脑电疲劳检测方法,即利用高铁司机脑电信号判断其疲劳状态。本文的主要研究内容如下:首先,本文运用脑机接口技术,采用Open BCI Cyton脑电采集装置在西南
截至2019年底,我国累计40个城市投入运用城市轨道交通达6730.27公里,新增运营线路共计968.77公里,创历史新高,这表明城市轨道交通正处在蓬勃发展的阶段。随着城市范围的扩展与城际地铁的发展,直流牵引供电地铁由于运行速度较慢而越来越无法满足现在与未来的需求。为了解决直流牵引供电地铁面临的诸如杂散电流等一系列问题,采用工频单相交流供电的新型交流牵引供电地铁应运而生。虽然交流电对埋地管线的电化
21世纪初期,随着人们越来越重视城市可持续健康发展,在城市化进程中,营造健康舒适的室外空间,逐渐成为了当下研究的热点话题之一。同时,我国迈入老龄化国家以来,接踵而来的老
当学习者进行复杂的认知活动时,会产生认知情绪并且对学习收益产生影响。困惑是伴随着认知冲突而产生的认知情绪,既有认知成分又有情绪成分,可能会对学习产生积极或消极的影
近年来无人机应用领域不断扩大,无人机执行的任务也越来越复杂,对于无人机定位系统的要求也越来越严格。传统的依靠全球定位系统(Global Positioning System,GPS)定位的方案难以满足无人机的定位需求。针对这一问题,本文通过融合多种感知信息对无人机定位算法及定位系统展开研究,主要内容包括如下三个方面:1)针对惯性导航累计误差大的问题,提出了基于BP神经网络的无人机速度预测算法。通过
WLAN技术由于其成本低、布点灵活、速率高等特点,被广泛应用于提供无处不在的移动宽带接入。除此之外,WLAN还被应用于数据回传等应用场景。传统WLAN接入网络对吞吐量有较高要求,而对可靠性,链路延迟等指标不够敏感,采用802.11协议基于竞争的载波侦听多址接入/冲突避免(Carrier Sense Multiple Access with Collision Avoidance,CSMA/CA)的
我国重载铁路正朝着更大运量、更安全、更绿色方向发展。随着运量需求增加和HXD系列大功率电力机车普及应用,部分重载铁路现有牵引供电系统供电能力不足、列车频繁过电分相时掉速甚至停车等问题日益凸显,严重影响到线路运营组织,成为阻碍重载铁路进一步提速扩能的瓶颈。针对重载铁路存在的不足之处,研究了重载铁路牵引电缆贯通供电方案,该供电方案供电能力强,能大幅减少甚至取消电分相,提高牵引变压器容量利用率和再生制动
接触网系统是将电能传输到电力机车或动车组上的重要环节,其质量和工作状态将直接影响电气化铁路的运输能力。其中接触线更是与受电弓直接摩擦接触,工作时需要承受冲击、磨损和工作张力,一旦运行状态异常或出现损坏,将直接影响到高速列车的安全运行。受复杂工作环境的影响,接触线故障时有发生,如果在故障发生前就对其有一个直观的预测,将有利于防患于未然并快速、准确地处理故障。因此,以接触线的历史故障数据为基础,基于数