基于文本与视觉信息的细粒度图像分类

来源 :图学学报 | 被引量 : 6次 | 上传用户:stslayer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一般细粒度图像分类只关注图像局部视觉信息,但在一些问题中图像局部的文本信息对图像分类结果有直接帮助,通过提取图像文本语义信息可以进一步提升图像细分类效果。我们综合考虑了图像视觉信息与图像局部文本信息,提出一个端到端的分类模型来解决细粒度图像分类问题。一方面使用深度卷积神经网络获取图像视觉特征,另一方面依据提出的端到端文本识别网络,提取图像的文本信息,再通过相关性计算模块合并视觉特征与文本特征,送入分类网络。最终在公共数据集Con-Text上测试该方法在图像细分类中的结果,同时也在SVT数据集上验证端
其他文献
高光谱目标表述是高光谱目标检测中的核心问题。在众多高光谱目标表述方法中,多示例学习方法(MIL)由于不需要精确的像素级语义标签等因素,而成为研究高光谱目标表述的一个有效方法。但是,面向高光谱目标表述的多示例学习方法中,存在正包内目标示例远少于背景示例的示例级数据不均衡问题,导致学习到的目标表述性能不佳。为此,提出一种面向不均衡数据的多示例学习方法,提取每个包中最可能为正的示例组成正示例集,以此为基
<正> 当前,在发展养猪业中疫病防治是一项极其重要的工作。生猪疫病防治措施的依据则有赖于大量流行病学资料作基础,而流行病学资料的获得,屠宰检验过程中疾病的统计与分析则
面对高分辨合成孔径雷达(SAR)图像的海量数据,学界广泛通过基于超像素的方法简化图像处理过程。一般适用于光学图像的超像素分割算法对存在斑噪的SAR图像分割性能均不够理想
<正> 1988年我省由秦皇岛港试验性出口肉用活马2批次122匹,获得成功。根据日本肉用活马市场的需求,对日出口活马具有广阔的前景。我国的检疫政策多年来我国对外出口活畜的经
在空间埋置组合式单元模型中,钢筋单元可埋置于混凝土单元任何位置,混凝土单元网格剖分不受钢筋位置的限制,方便实用,但需确定钢筋单元两端在混凝土单元表面的位置坐标。因此
针对特殊应用背景下的小批量圆形件下料问题,在顺序启发式过程的基础上,引入分组的思想,提出基于分组选择策略的顺序分组启发式算法,并将顺序分组启发式算法与递推算法相结合生成
面向对象的变化检测技术在高分辨率遥感图像领域已经得到广泛地应用。由于遥感图像受光照、大气环境等成像条件的影响,图像特征的质量也参差不齐,筛选出高质量的特征成为对象级遥感图像变化检测的关键。针对此问题,提出了一种基于Relief-PCA特征选择的对象级遥感图像变化检测方法。首先,对原始图像进行多尺度分割获得目标对象,并提取对象的光谱特征与纹理特征;然后,利用对数比值法获得变化矢量,再使用Relief
<正> 家兔的普通病是一类多发病,常发病。一年四季中各种年龄的兔均可发病。有时可发展为群发病,给养兔业带来重大的损失。这类病的主要原因是饲养管理不当所致,涉及的因素很