图像描述相关论文
由目标检测算法提取的目标特征在图像描述生成任务中发挥重要作用,但仅使用对图像进行目标检测的特征作为图像描述任务的输入会导致......
图像描述是一门结合计算机视觉与自然语言处理领域的交叉学科,被广泛应用在智慧交通、生活娱乐、网络图像分析以及帮助视障人士感......
针对图像描述方法中对图像文本信息的遗忘及利用不充分问题,提出了基于场景图感知的跨模态交互网络(SGCNet)。首先,使用场景图作为图像......
目前,基于编码器-解码器框架图像描述模型在编码阶段未考虑同一个单词在不同语句中的差异,在解码阶段未考虑语言序列的层级结构。为......
针对现有多模态命名实体识别(Multimodal Named Entity Recognition, MNER)研究中存在的噪声影响和图文语义融合不足问题,本文提出一......
【目的/意义】解决少数民族传统文化研究中信息解读的“语义鸿沟”、耗时低效、非标准化等问题,对实现少数民族传统文化研究中生活......
图像语义理解是指对图像中包含的信息进行解析,研究图像属于哪一类场景、图像中有哪些目标、各目标间的语义交互关系等。人类生活......
图像描述的任务是根据输入图像自动生成描述该图像的语句,属于计算机视觉与自然语言处理的交叉领域.针对传统注意力机制提取特征能......
甲状腺结节是临床常见病和多发病。在临床中,普遍采用超声成像技术对甲状腺结节成像,生成的超声图像是医生对甲状腺结节进行诊断和......
图像描述是场景理解的重要研究内容之一,旨在根据图像内容生成相应的描述性文字,是一个充满挑战性的任务。图像描述同时涉及了计算......
图像描述任务的目的是给定一张图像,输出含有该图像的语义信息的一段描述性文字。这段文字不但要描述出图像中出现的主要实体,还要......
随着互联网的快速发展,每天产生的图像规模都以亿计,呈爆炸式增长,这些图像具有很高的社会价值与商业价值。将图像与自然语言相结......
计算机视觉和自然语言处理是当前人工智能研究的两个热门方向,而图像描述则是两者交叉融合的一个综合性研究课题,近几年也越来越多......
学位
图像描述任务类似于人类的看图说话,目的在于根据一张图像生成描述性语言。图像描述任务不仅能够为视力有障碍的人提供很好的辅助,......
随着互联网的发展,网络已经成为人们日常生活中必不可少的一部分。人们获取新闻时事的主要渠道已经由传统的纸质版媒介转化为以互......
随着互联网和人工智能的迅速发展,图像描述任务在人机交互和儿童教育等领域越来越受到重视。图像描述是通过结合计算机视觉中的特......
近年来,随着人工智能技术的快速发展,自然语言处理和计算机视觉在理解图像和生成文本方面取得了巨大的成绩,且具有广泛的实际应用......
随着互联网行业的发展以及各行业需求,起着传达信息和宣传教育作用的图像越来越多的出现在人们的视野中。然而,图像能够让人记住的......
图像描述顾名思义,即给定一张图片,算法自动生成一段描述图像内容的文本。该任务对人来说很容易,但对于机器却非常有挑战性。这需......
显著性目标检测旨在识别出图像中人类最为感兴趣的物体或者区域,并将其完整准确地分割出来,其在计算机视觉领域中扮演着重要的角色......
图像描述(Image Captioning)是指计算机对给定图像自动生成简洁的自然语言描述。计算机图像描述能够将图像信息转化为文本信息,从而......
为了实现在光线不佳、夜间施工、远距离密集小目标等复杂施工场景下的图像描述,提出基于注意力机制和编码-解码架构的施工场景图像......
为了让科学家快速定位实验关键过程,获取更为详细的实验过程信息,需要对空间科学实验自动添加描述性文字内容.针对空间科学实验目......
基于encoder-decoder的深度神经网络在图像描述任务中获得了很好的表现,LSTM解决梯度消失的良好能力使其成为解码器的主流.LSTM的......
视觉问答作为多模态任务,需要深度理解图像和文本问题从而推理出答案.然而在许多情况下,仅在图像和问题上进行简单推理难以得到正......
静态图像中的目标识别是计算视觉的基本任务。通过提供目标相关信息,如类别、位置等,目标识别成为连接图像底层识别任务和高层应用......
大数据时代的到来以及深度学习的兴起使得图像描述成为了人工智能热门研究方向。传统的方法虽然在某种程度上能够完成基本的描述任......
随着互联网的发展和移动通信技术的进步,短视频成为新的信息传播载体。短视频的用户量和数据量十分庞大,其发布需要进行内容审核,......
高光谱图像描述是对高光谱图像进行有效分类和目标探测的基础。成像设备技术的发展,使得高分辨率高光谱图像的空谱域局部特征能够......
图像描述任务是一种重要的现代智能图像应用技术,它利用精炼而又准确的自然语句对图像内容进行的概括性描述,非常广泛的被研究,融......
随着互联网的快速发展,图片、文字、视屏等各种模态的数据爆炸式增长,人类进入了大数据时代。人们产生了从海量数据中快速、准确获......
本文提出了一种联合二维主分量分析(Joint-2DPCA)的图像描述方法,并将其应用到人脸识别.该方法不仅继承了现有2DPCA方法可直接面向......
传统图像描述算法存在提取图像特征利用不足、缺少上下文信息学习和训练参数过多的问题,提出基于ViLBERT和双层长短期记忆网络(BiL......
针对当前遥感目标检测方法只能识别出遥感目标的类别及位置,无法生成与遥感图像内容相关文本描述的问题,提出了一种基于注意力和强......
视觉场景理解包括检测和识别物体、推理被检测物体之间的视觉关系以及使用语句描述图像区域.为了实现对场景图像更全面、更准确的......
针对传统虚假新闻检测方法主要采用图像统计学和图像分布式表示特征导致没有深层次挖掘图像所表达的文字含义的问题,设计了在融合......
现有图像描述模型存在解码端层次不深、训练效率低下的问题,且生成的描述语句在语言连贯性和内容多样性方面效果欠佳,为此,提出一......
这篇译文是论文集《抽象的图像学:非具象图像与现代世界》的导言,作者克罗地亚学者克莱希莫·普加尔(Kresimir Purgar),是斯特罗斯......
图像描述任务是图像理解的一个重要分支,它不仅要求能够正确识别图像的内容,还要求能够生成在语法和语义上正确的句子。传统的基于......
前言 大多数飞行员按照教学指令在各种地面设备上能够体会到一些定向障碍错觉。为了加强在他们进行操作的飞行环境中的空间定向障......
在计算机视觉研究领域中,对人脸进行描述和编码一直都是一个很受关注的研究课题,人脸图像的描述与编码有着广泛的作用,是许多其它的人......
随着互联网上数字视频和图像的不断增加,用人工的方式逐一浏览并标注它们的内容变得不切实际。为了更好地管理和利用这些图像和视......
随着信息科学技术的高速发展,伴随而来的是多样的媒体数据飞速增长,这得益于数字设备的普及和存储技术的发展。面对大量无标签数据......
图像的表示与匹配技术是图像处理、分析与理解的基础。它对图像的后续处理、分析和识别具有十分重要的作用。近几年来,基于图理论......
一般地,形如y=kx+b(b≠0)的函数是一次函数,其中k、b是常数,其函数图像是最简单的直线,图像的斜率反映k值的大小,b值是截距.rn一次......
用图像描述物理规律是高中阶段常用的方法,物理规律用数学表达出来后实质上是个函数关系式,如果这个函数关系式中只有2个变量,就可......