基于递归网络的图文标注算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:menxiaolong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展,在互联网上同时包含图像和文本的数据在不断增加,例如新闻和对应的插图,视频画面和字幕,还有用户上传的图文短讯等。如何更好地理解现有的海量互联网数据,意义十分重大。为了利用同时包含图像和文本的数据,需要算法能理解图像内容和其文本描述之间的联系。所以,在图像和自然语言结合的研究领域中,自动图文标注成为了一个关键的任务。自动图文标注任务的过程是:输入一张图像,通过分析它的视觉信息,输出一个描述图像内容的语法正确的文本句子。自动图文标注是一个困难的问题,过去结合传统图像特征提取方法和语言模型的算法,效果不能令人满意。随着深度学习技术的发展,主要基于递归网络,并结合利用了深度卷积网络的算法,在自动图文标注问题上取得了较大的进展,但仍存在较多问题。在研究基于递归网络的自动图文标注算法的基础上,本文主要有如下贡献:1、在英文的图文标注系统中,本文提出了一个基于递归网络和深度卷积网络的改进模型(WICN模型)。WICN模型针对现有方法的不足,首先实现描述图像概念的单词检测,并结合检索方法进行改进,然后自适应地融合图像特征和单词特征,最终送入LSTM网络进行训练学习,从而实现更准确的英文图文标注系统。2、在中文的图文标注系统中,由于现有的算法研究都基于英文语言,缺乏对中文语言的研究。本文根据中文和英文语言的不同特点,首先实现了一个基于中文统一编码的自动图文标注算法,该方法避免了对中文语料使用分词算法引入的误差累积。然后,针对中文统一编码容易出现词语错乱的问题,本文结合n-grams模型对递归网络的输出进行限制,提出一种后分词算法,从而实现更准确的中文图文标注系统。本文在Flickr8k,Flickr30k和Pascal VOC 2008数据库上,对WICN模型进行验证并与其他方法对比,证明了WICN模型在解决英文自动图文标注问题上有显著的提升。本文在中文Flickr8k数据库上,对比了本文提出的不同中文自动图文标注问题的解决方法,验证了本文提出的后分词方法的思想,证明了该方法在解决中文自动图文标注问题上的性能提升。
其他文献
目的:多重打击弥漫性大B细胞淋巴瘤是一种以分子遗传学特点命名的高度侵袭性的弥漫性大B细胞淋巴瘤。该类肿瘤的发病率低,临床病理特点复杂,预后差。由于多重打击弥漫性大B细
目的:目前甲状腺癌(Thyroid carcinomas TC)是上升最快的实体肿瘤,本研究通过免疫组化方法(Immunohistochemistry IHC)检测甲状腺癌中增殖指数(Ki67)和BRAF(鼠类肉瘤滤过性毒菌致癌
农民工全家进城落户后,宅基地使用权如何处理,法律并未作出明确规定。随着大规模的农民工市民化进程加快,农民工全家进城落户后土地权益如何处理,成为一个迫切需要探索解决的
有效教学最显著的特征指的是学生在老师开展一段教学活动之后能够从中获得对应的知识进步或者能力上的提高。相较于高效教学两者的出发点是相同的,那就是教学过程产生的效益
目的初步探讨植物甾醇对人神经母细胞瘤SH-SY5Y细胞增殖和凋亡的影响。方法采用体外细胞培养的方法,用不同浓度的植物甾醇与细胞共同培养,倒置显微镜观察细胞形态,MTT法测定
<正>1.中药制剂中新辅料及新工艺的应用1.1 新辅料的开发应用近十多年来,国外发达国家的制药工业发展迅速,先后开发出微囊、毫微囊、微球、脂质体、透皮给药系统等新剂型、新
会议
为研究木麻黄Casuarinateae.种子苗困难地造林,以木麻黄为试验材料,用不同渗透势浓度的聚乙二醇(PEG-6000)模拟干旱胁迫,探讨干旱胁迫对木麻黄种子发芽率、发芽势、胚轴和胚根长度
肝癌是当今全世界发病率及致死率最高的癌症之一。发展新型高效、快速的肿瘤标志物筛选方法,以及开发对肿瘤病理组织具有高特异性、高灵敏度并且化学性质稳定的分子识别探针
夏布于2008年被国家文化部确认为&#39;国家级非物质文化遗产&#39;,作为一项具有千年历史的手工织造技艺,不仅具有历史价值,更具有文化价值。同时为了更好的传承与发展,夏布的
<正>学习英语课程,学生应该把学习和实际中的运用相结合,逐步掌握英语知识和基本技能,从而提高语言实际运用的能力。这个学习过程是锻炼他们的意志,陶冶他们的情操,拓展他们