基于深度学习的Logo检测与识别技术研究

来源 :电子科技大学 | 被引量 : 8次 | 上传用户:loverbeyond
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来计算机视觉技术的不断发展和普及,目标检测与识别技术已经在医疗卫生、国民教育、城市交通、大众娱乐等越来越多的方面体现了其带来的便利和优势。其中Logo检测与识别技术作为目标检测与识别技术的一个重要应用,其在城市智能交通、文档检索分类、商业广告分析等领域也有着不可忽视的应用前景。传统的Logo检测与识别技术大多以文档中单一Logo为研究为切入点,其检测识别环境相对简单,应用研究难度较低。本文以较新的目标检测与识别技术为研究基础,以社交网络中运动品牌服饰Logo检测与识别为应用切入点,进行了基于深度学习的Logo检测与识别技术研究。主要工作包括数据集构建、数据集扩充、深度学习模型选择与改进三个方面。首先,本文对Logo检测与识别领域现有的公开数据集进行了调研分析,发现现有的公开数据集无法满足本文特定的研究与应用需求,所以采用了网络爬虫技术和人工筛选标注相结合的方式构造了一份适合本文研究使用的十种运动品牌Logo数据集FlickrSport Logos-10。然后,由于进行深度学习模型训练需要大量的标注数据,然而进行数据集的标记非常繁琐且会耗费大量的人力物力,所以使用了图像人工合成技术对FlickrSport Logos-10数据集扩充了10万张合成图片,同时在后续的实验中证明了该种数据扩充方式的有效性。最后,基于FlickrSportLogos-10数据集,选取了三种Logo检测与识别算法进行了对比研究,并对三种检测识别算法的检测识别效果、检测识别运行时间、模型可视化等方面进行了相关实验,最终总结出了三种检测识别算法所适用的不同应用场景。综上,本文所进行的研究充分说明了基于深度学习的Logo检测与识别技术的可行性以及优势性,并且验证了图片人工合成技术进行Logo数据集扩充的有效性。本文研究的Logo检测与识别技术相比于传统研究,其检测识别环境更加复杂,识别难度更大,同时使用的检测识别方案效果更佳。
其他文献
目的探讨以肿瘤性胸腔漏出液为主要表现的多发性骨髓瘤病例的临床特点。方法报告解放军总医院血液科2015年收治的1例以肿瘤性胸腔漏出液为主要表现的多发性骨髓瘤病例,就其临
淄博矿业(集团)有限公司唐口矿井为特大型千米立井,表土层厚,矿井涌水量大,排水费用高,井下供水减压难度大,常规的设计方案不能很好的解决这些问题。通过设计优化,提出了将井下