基于卷积神经网络的自动图像识别与标注

来源 :福州大学 | 被引量 : 0次 | 上传用户:limingxing0623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索是计算机视觉领域中具有重大价值的课题,自动图像标注是图像检索和图像理解的关键步骤,行人重识别是图像检索在真实行人场景中的具体应用。本文对自动图像标注和行人重识别分别进行研究,针对训练深层网络容易出现过拟合、传统标注模型结构繁琐、真实场景行人重识别研究较少等问题,在数据增强、标注框架、实际应用等方面提出解决方法,本文的主要工作包括:(1)针对深层神经网络难以训练小规模数据集、传统数据增强方法难以大量扩充多标签数据集等问题,在部分传统数据增强方法的基础上,提出了基于Wasserstein生成对抗网络的多标签数据增强方法(ML-WGAN),该方法通过训练使WGAN的生成器逐渐逼近单张多标签图像的数据分布,将迭代过程中生成的图像作为原图数据的补充,该方法能够方便大量地扩充多标签数据集,减少训练深层神经网络的过拟合问题,从数据本身提升图像识别、标注模型的泛化能力。(2)针对传统浅层模型泛化能力弱、传统标注模型将特征提取与分类标注视为两个独立任务进行研究而导致的结构繁琐等问题,提出了基于端到端深层卷积神经网络(E2E-DCNN)结构的自动图像标注模型,该模型首先将图像标注转换成多标签分类问题,使用ResNet等深层CNN结构进行自适应特征学习,然后配合多重交叉熵损失函数建立端到端标注结构进行训练,最后通过对深层CNN的结构优化和结合深度学习数据增强方法提升标注效果,该模型只使用单个深层CNN结构就能完成自动多标签图像标注任务,同时有效地改善标注效果。(3)针对目前行人图像检索在真实场景应用中的研究较少,提出了基于数据增强的Faster-RCNN行人重识别方法,该方法将深度学习数据增强和改进的CNN目标检测结构(Faster-RCNN)等技术相融合,首先通过深层CNN预训练模型提取真实场景下的行人位置,然后使用非参数化的损失函数计算目标行人的距离度量,该方法将行人检测和行人重识别整合到单个端到端框架,同时能够有效地优化行人重识别效果。通过在图像标注公共数据集、行人重识别公共数据集和真实场景数据集上的实验结果表明,本文提出的方法有效减少了模型训练中的过拟合问题,提升了中低频标签的标注效果和真实场景下的行人重识别效果。综上,本文提出的方法在自动图像标注方面能较好地提升整个模型的召回率,在行人重识别方面能提升在真实场景下的行人重识别效果。
其他文献
目的探讨康莱特注射液联合顺铂胸腔灌注治疗恶性胸腔积液的有效性与安全性。方法将46例病理诊断为恶性胸腔积液,中医证型属气阴两虚、脾虚湿困的患者随机分为康莱特和顺铂联
由于存在光的衍射极限,光学成像一直以来被认为无法突破衍射极限而获取更高的空间分辨率。近年来出现的超分辨成像技术打破了衍射极限,将可分辨的空间尺度提高到了250纳米以
民间融资的形式多样,中国人民银行根据交易主体、融资用途与利率水平的不同,将民间融资分为四种类型,分别是低利率的互助式借贷、利率水平较高的信用借贷、不规范的中介借贷
星敏感器作为姿态传感器在深空探测、卫星、弹道导弹、飞机、舰船等精确姿态测量与姿态标校中得到广泛应用,但其在高动态环境下的姿态测量精度下降严重,如何提升星敏感器的动
开花植物的交配方式和繁殖策略都非常复杂,开展植物繁殖特征方面的研究,有助于我们对植物的繁育机制进行合理地解释。雄全异株性系统是一种非常罕见的繁育系统,该性系统植物
在对海南省定安县农村垃圾现状进行调查的基础上,分析了垃圾处理处置中存在的主要问题,提出了农村垃圾处理处置的措施。
在现阶段的中国,房地产的价格具有多重垄断性的特点,其供给多是满足高收入人群的居住和投机需求,而非普通民众的基本住宅保障需求。所以,这需要我国政府实施适当的规制手段来
检察委员会自上世纪中期创立以来,作为我国检察制度中的一大特色,对于加快社会主义法制进程起到了不可估量的作用。但是与检委会的作用极不相称的事实却是对其的关注和研究十
作为一门迅速发展着的学科,非线性时间序列分析提供了由有限维度的观测数据探究高维背景系统的动力特征的理论方法。这样,许多曾经存在着建模或观测困难的复杂非线性系统的研
北黄海盆地位于中国东部海域,处于华北地台向海的延伸部分,是一个勘探程度较低的近海中-新生代断陷盆地。北黄海盆地受岩浆活动影响强烈,其在中生代接受陆相沉积,发育了一套