基于对象注意力模型的图像描述研究

来源 :北京印刷学院 | 被引量 : 0次 | 上传用户:hlpaccp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述即向计算机输入图片,计算机生成对应描述图片内容的文本句子的过程。图像描述在现实中有着广泛的应用,例如航天、教育、自动驾驶、商品自动标注和搜索引擎等。因此图像描述的研究有着广泛而深远的意义。基于注意力机制的方法是图像描述领域广泛应用。基于注意力的图像描述方法,具有容易训练、参数量少、自动化运行、准确率高且特征丰富等优点。然而图像描述注意力机制方法存在着图像关联性特征较弱、提取特征浅显和文本与图像关联较弱等缺点。这些因素影响着模型的输出精度。论文从这几个方面进行改进,提升图像描述的预测精度。(1)针对注意力模型中特征关联性较弱,无法有效结合图像文本特征的缺点,本论文提出特征选择网络模型。特征选择网络模型在较低层次的特征图上添加掩膜进行筛选,有效地克服了特征之间关联性较弱的缺点。实验结果表明,使用特征选择网络模型,经过约30h的训练,模型预测速度大约75帧/s,模型精度在原来基础上提升0.1。(2)针对注意力模型提取特征浅显的问题,论文提出对象注意力模型。论文将激活函数与分类特征的乘积作为掩膜,并将掩膜与分类特征相乘,从而构成对象注意力模型。它有效地克服了注意力模型提取特征浅显的问题。(3)针对传统模型中输入文本与图像关联较弱的问题,论文在对象注意力模型上,提出融合层网络。融合层网络融合文本与图像,并将融合结果作为对象注意力模型解码输入,克服了文本图像关联较弱的缺点。实验表明,结合融合层与对象注意力结构的模型,训练时间大约48h,预测速度大约55帧/s。实验精度在原来基础上提升0.15。实验中采用的数据集包含Flickr8k,Flickr30K和COCO2014。其中Flickr数据集包含约4万张图片,COCO包含约8万张训练图片,4万张测试图片,4万张验证图片。实验评价方法采用BLEU方法和METEOR方法。本文工作主要分两部分,其一对传统注意力模型进行了特征选择改进,提出了特征选择网络。其二,本文提出对象注意力模型和融合层。通过对比可知,特征选择的确有助于改进模型效果,而更深层次的对象特征对于图像描述结果影响比重很大。这为图像描述领域后续的发展提供了新的视野。
其他文献
图像超分辨率重建算法(Image Super Resolution,SR)是通过计算机软件技术将低分辨率图像(Low Resolution,LR)重建为细节丰富的高分辨率图像(High Resolution,HR)的一种技术。当下现有的图像SR技术主要是在插值、重建和学习的基础上进行研究,而随着一些领域中对于重建图像质量的要求越来越高,传统方法方法存在重建图像模糊、锯齿等问题,不能满足具体的工作要
教师的流动制造了流动的教师这一特殊的群体,而地域融入则是流动教师所面临的一个特殊问题。所谓流动教师的地域融入是指教师对流入地区的自然、经济、政治、文化等因素不断地接受、排斥、内化和综合理解的动态过程,其结果常常表现为教师的环境认同、文化依恋、社会归属、工作承诺。这四个内容也构成了地域融入的基本框架,教师流动中地域融入的影响主要体现在,地域融入影响流动教师的工作态度,教学质量和教师专业发展。流动教师
经气刀吹落的焊接钢管热镀锌液,在工作台面上凝固堆积后返回锌锅,容易使热镀锌锅内锌液的温度、含气、夹渣等熔体质量的稳定调控造成困难,从而影响焊接钢管的热镀锌质量与效
内蒙古盛产天然放牧牛羊肉,规模化舍饲也在迅速发展,不同的饲养模式必然造成肉品质的差异。脂肪和脂肪酸(Fatty Acids,FAs)不仅关系肉的营养特征,也影响或决定其品质和滋气味
行政许可评价是检验行政许可事项是否符合法治要求及是否有存续必要性的有效方式。伴随着我国行政审批制度改革的不断深入和行政许可负面清单制度的试点建设,行政许可的调整、清理工作势必愈发重要。行政许可评价是行政许可清理的前提和依据,可以为行政许可清理活动提供有力的信息支撑,因此,行政许可评价的作用也愈发明显。《行政许可法》第二十条虽然对行政许可评价活动进行了顶层设计,但是,由于条款本身规定的较为粗略,可操
互联网的发展促进家庭宽带的迅猛增长,运营商新增收入的主攻方向已经由话务转为宽带业务并日趋成为支柱业务。现有PON网络已经无法支撑未来的网络发展,迫切需要将现有网络向
于2017-2018年研究了雪茄烟杈烟、二茬烟和带茎调制烟叶的品质。共三个试验,分别为:杈烟烟叶与普通茄芯烟叶品质对比,带茎调制烟叶与采叶调制烟叶品质对比,不同留叶数二茬烟
近年来信息技术发展速度与数据更新速度加快,而数据来源复杂多样,数据量以前所未有的速度迅猛增长。为了从庞大的数据中,快速准确地获取有价值的信息,聚类分析作为一种重要的数据分析技术被广泛研究,但仍存在初始聚类中心选择敏感,数据分布对聚类结果影响较大,参数选择敏感,聚类结果稳定性差以及算法时间复杂度高等缺点。P系统是根据生物间的交流、反应抽象得到的计算模型,具有强大的计算能力,可与图灵机相媲美。将P系统
微生物电合成系统(Microbial electrosynthesis system,MES)是近年兴起的、以微生物为催化剂,将阳极有机废水中化学能转化为电能,用于阴极生产氢气或有价化学产品的技术。本研
随着环境恶化的逐渐加重和人们对于生活质量要求的提高,绿色创业成为越来越多的研究者和企业家关注的问题,更多的企业将绿色创业导向带来的新科技突破和新商业模式作为获取持续竞争优势的关键方法。20世纪70年代,就有学者认为绿色化可能为企业提供新的、利润充足的市场;但是也有一些研究认为将提供绿色产品和服务作为企业战略会对企业绩效产生负面影响。先前研究对于绿色创业导向对企业绩效的影响没有得出一致的结论。分析相