基于Encoder-Decoder框架的双监督机制自然场景文本识别

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:wyxxzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对复杂的自然场景下文本较难识别的情况,特别是对不规则文本的识别仍很具挑战性,提出了一种具有注意机制的双监督网络.考虑到在现实世界中阅读单词时通常不会在脑海中纠正他,而是调整焦点和视觉范围.在特征提取过程中利用几何结构可调的可变形卷积层结合文本注意模块,强制模型专注于文本区域,无需对不规则的文本进行位置纠正.该文的总体框架有两个分支监督,一个监督分支来自上下文级别建模,另一个监督分支来自一个额外的监督增强分支,旨在处理角色级别的不明确的语义信息.这两个监督可以相互促进,并产生更好的性能.所提出的方法可以识别任意长度的文本,并且不需要任何预定义的词典.实验表明,与对比方法相比,提出的方法在场景文本基准数据集上的识别精度有明显提升.
其他文献
目的 探讨不同术式治疗复发性翼状胬肉的临床效果及利弊.方法 选取2018年3月至2020年9月于我院手术治疗的126例复发性翼状胬肉患者,以随机抽样法分为3组,每组42例,对照组采用翼状胬肉切除+自体结膜瓣移植术,观察组分翼状胬肉切除+结膜带角膜缘干细胞移植术,翼状胬肉切除+瑞济无滤纸型生物羊膜移植术.结果 对照组一年后再次复发率为14.3%,翼状胬肉切除联合结膜带角膜缘干细胞移植术复发率为4.8%,翼状胬肉切除联合生物羊膜移植术复发率为7.1%,对照组与后两组间有统计学差异,后两组无明显差异,但翼状胬肉
近年来,深度学习技术广泛应用于侧信道攻击(side channel attack,SCA)领域.针对在基于深度学习的侧信道攻击中训练集数量不足的问题,提出了一种用于侧信道攻击的功耗轨迹扩充技术,使用条件生成对抗网络(conditional generate against network,CGAN)实现对原始功耗轨迹的扩充,并使用深度神经网络进行侧信道攻击.通过选择密码运算中间值的汉明重量(hamming weight,HW)作为CGAN的约束条件,将CGAN生成模拟功耗轨迹作为多层感知器(multi-l
知识融合是知识图谱技术的关键环节,而传统机器学习算法较难满足异构大数据环境中知识融合的准确性及实时性需求.提出一种结合概念漂移检测算法与无监督反向验证算法的高可靠、低复杂度知识融合方法.该方法利用贝叶斯估计进行实体对齐与属性融合的同时,周期性进行基于孤立深林算法的概念漂移检测与基于自组织映射网络的反向实体消歧,以此有效互补监督学习的样本依赖性及无监督学习的高复杂度特性,从而提高知识融合的可靠性与实时性.提出算法在公开数据集与国网安徽省电力公司知识图谱数据库中分别进行了数据实验,通过对数据模型可靠性、实体对
目的:统计分析复方异丙托溴铵联合布地奈德雾化治疗对慢性阻塞性肺疾病急性加重期的应用效果.方法:随机抽取2019年1月至2020年12月期间确诊入院的60例慢性阻塞性肺疾病急性加重期患者作为数据分析基础,对其进行对照组和实验组划分,均为30例,分别开展常规治疗以及常规+雾化吸入治疗,对比两组肺功能.结果:实验组PEF、FEV1、FEV1/FVC肺功能指标结果均高于对照组(P<0.05).结论:慢性阻塞性肺疾病急性加重期患者接受复方异丙托溴铵联合布地奈德雾化治疗效果显著,应用价值高.
信息时代下打开了人们获取信息的渠道,便捷了各项工作流程,却也使得大量未经筛选的信息进入到人们的眼前,对学生的自制力提出了要求.在中职德育管理中,既要顺应信息技术发展潮流,展开必要的德育技术更新、开放教育心态,也要及时做以调整,关注到其中未经磨合、有所疏漏之处,及时查缺补漏,逐渐优化德育工作,实现智能班级德育管理.
边缘计算技术的发展为计算密集型业务提供了一种全新的选择,低能耗、低时延、实时处理等词语不断被提及,任务卸载引起了众多学者的注意.任务在本地执行还是卸载到服务器上执行,以及卸载到哪一台服务器上执行成为必须要解决的问题.在多智能体环境中提出一种新的目标函数,并构建数学模型;建立马尔可夫决策过程,定义动作、状态空间以及奖励函数,通过深度强化学习DRQN优化任务卸载策略.仿真实验结果表明,DRQN在能耗、花费和时延上的综合表现优于随机卸载、DQN等算法,证明了提出算法的有效性和实效性.
目的:探讨在视网膜静脉阻塞(RVO)黄斑水肿患者治疗中应用康柏西普的疗效.方法:病例选自2019.01-2021.01来院就诊的视网膜静脉阻塞患者92例,将实施治疗方案不同均分为2组.将接受激光光凝者纳入常规组,将联合激光光凝与康柏西普治疗者纳入实验组,观察并统计2组临床疗效.结果:经治疗1个月及3个月后,实验组视力指标为(0.41±0.14)、(0.49±0.23),显著优于常规组(0.32±0.20)、(0.35±0.21),T=2.5003、3.0487(P<0.05).结论:联合激光光凝与玻璃体腔
目的:观察耳穴埋豆治疗眩晕病的护理效果.方法:将64例眩晕病患者随机分为观察组32例和对照组32例,对照组采用西医常规治疗护理,观察组在对照组基础上,采用耳穴埋豆疗法,分别于治疗前,治疗后10d、20d、30d,对两组患者眩晕症状(ss-SF)进行疗效评分,结果:观察组总有效率为96.8%,对照组总有效率为71.8%,两组间比较,差异有统计学意义(P<0.05);观察组治疗20d及30后vss-SF评分与对照组比较,差异有统计学意义(P<0.05,P<0.01).结论:耳穴埋豆疗法能使眩晕患者症状减轻,提
目前主流的SLAM地图构建方法在环境建模中一般要借助人机交互平台,人工成本高,独立性较差.提出基于动态矩阵的未知环境地图构建算法,可以在完全未知的陌生环境中,基于二维空间栅格地图建模并利用A?算法进行回溯,独立实现地图信息的全覆盖采集.针对传统的局部覆盖路径规划算法存在重复率高、运行效率低的问题,进行了改进设计,一旦检测到封闭区域则优先处理,并采用沿边循迹和牛耕式运动相结合的方法进行子区域路径规划.算法使用Matlab进行仿真设计,通过Webots机器人仿真平台进行了验证,仿真结果表明,改进算法与传统的局
针对路侧交通监控场景和智能交通管控需要,提出轻量型的车辆检测算法GS-YOLO,解决现有模型检测速度慢、占用内存多的问题.GS-YOLO借鉴GhostNet思想将传统卷积分为两步,利用轻量操作增强特征,降低模型的计算量.在主干特征提取网络中引入注意力机制,对重要信息进行选择,提高模块的检测能力.另外参考SqueezeNet结构,使用Fire Module和深度可分离卷积减少模型参数,模型大小从244 MB降低到34 MB,内存占用降低了86%.使用Roofline模型对实验数据和模型实际性能进行分析,结果