【摘 要】
:
随着移动互联网的快速发展,基于视觉的商品识别技术在无人结算,营销推广及智能售后等领域发挥的作用越发显著。当前的商品识别算法大多依赖于卷积神经网络,并在海量数据的驱动下,完成对模型的训练。然而,由于商品种类繁多,为每一种商品收集到足够的训练集,需要耗费大量的人力物力。为此,本文提出了一种单样本条件下的商品识别算法,在只有一张商品图片的条件下,进行商品识别。本文将商品识别问题拆分为两个子问题,一是从海
论文部分内容阅读
随着移动互联网的快速发展,基于视觉的商品识别技术在无人结算,营销推广及智能售后等领域发挥的作用越发显著。当前的商品识别算法大多依赖于卷积神经网络,并在海量数据的驱动下,完成对模型的训练。然而,由于商品种类繁多,为每一种商品收集到足够的训练集,需要耗费大量的人力物力。为此,本文提出了一种单样本条件下的商品识别算法,在只有一张商品图片的条件下,进行商品识别。本文将商品识别问题拆分为两个子问题,一是从海量的商品模板中,检索目标商品的相似商品集。此问题的难点在于,单样本条件下,如何实现从商品图像到向量的映射。二是对检索出的相似商品集,基于几何约束,做进一步的精确识别。其难点在于如何保证局部特征的速度与精度。针对两个子问题,本文的主要工作如下:(1)针对海量商品模板中的检索问题,提出了一种基于胶囊网络的图像嵌入算法,用以实现从商品图像到向量的映射。本文使用改进的胶囊结构将图像特征向量化,赋予了模型空间约束能力,减少了对训练样本的需求。同时,本文还提出了一种阶梯式训练法,可以有效弥补由于训练样本数量差异带来的性能损失。在商品数据集上的测试结果表明,在单样本条件下,本文提出的图像嵌入算法与同等深度的卷积神经网络相比,mAP(mean Average Precision)提高了 9.1个百分点,达到了 68.2%。(2)针对商品的精确识别问题,设计了一种二进制深度局部特征,可作为几何验证求解的基础。本文使用深度卷积网络提取图像局部特征,实现了对光照、视角等因素的良好鲁棒性。同时,通过压缩网络深度和设计特殊的隐层,实现了对特征的二进制表示,大幅提升速度。实验表明,本文提出的局部特征提取算法,精度与当前算法相当,速度有明显优势,是其他深度局部特征速度的3-4倍,达到了 22FPS。(3)基于上述两点算法,本文设计并实现了一套商品识别系统。根据商品外观特点,仅需要上传一张或几张商品模板图,系统便可以对此商品的其他图像进行识别。同时,系统还能使用用户上传的图像数据,对算法本身进行自适应优化。
其他文献
随着国家工业的发展,经济的突飞猛进,每天有大量工业污水排入河流。水环境正遭受严重的污染。因此,国家逐渐出台水环境治理把控政策,从源头治理水环境污染,加强入河排污口监
随着不可再生能源消耗的加剧,造成环境污染日趋严重,发展电动汽车再次吸引世人的高度关注,轮毂电机电动汽车相较于传统汽车其结构大为简化,整车质量得到减轻,提高了传动效率,
城乡公交一体化是城乡公共服务均等化和公交优先发展的客观需要。随着我国农村城市化进程的加快,农村居民的公平意识日益增长,越来越多人希望拥有和城市居民同等的公交待遇。
图谱理论是代数图论及其应用研究领域的一个重要方向,矩阵在研究图谱理论中发挥了重要的作用.同时,人们引入了与超图的结构有密切联系的张量,如:邻接张量、拉普拉斯张量和无符号拉普拉斯张量等.张量作为矩阵的一般形式推广,为超图的谱理论研究提供了一个重要的工具.关于图的特征值和图结构关系的研究是图谱理论的核心问题,超图是图的推广,随着张量特征值研究的不断深入,超图谱理论得到了人们广泛的关注.超图谱理论主要研
近年来,随着互联网技术的高速发展,人们越来越重视信息传输过程中的安全性问题。无载体信息隐藏技术的出现有效的保证了信息在隐蔽传输过程中具有良好的安全性以及抗攻击性,但是目前无载体信息隐藏的研究主要集中于以图像和文本作为载体,基于流媒体的信息隐藏手段发展仍然缓慢,而载体的类型往往会对隐藏信息容量以及信息的传播方式产生限制。本论文在无载体信息隐藏方法中结合计算机自动作曲以及音乐信息检索等技术针对流媒体的
在近地面炮弹武器的设计、测试和改进中,确定炮弹能在预先设计的位置范围内爆炸是评价炮弹毁伤效能的一个重要指标。目前,采用图像处理设备检测爆炸目标普遍存在检测精度低、硬件成本高、系统功能单一和不支持远程操作等缺点。而且,在目标检测系统中应用较多的FPGA处理器,虽然具有高并行化运算能力,但对于算法中复杂逻辑的判断难以处理。为此,本文以Zynq为核心处理器,充分发挥其软硬件协同设计的优势,研制出一套集图
随着人工智能和机器学习的迅猛发展,卷积神经网络作为深度学习的代表算法可以轻松实现图像识别和分类任务,被认为是目前最有效的图像处理方法,在自然语言处理、计算机视觉等领域得到了广泛的应用。随着图像分类中识别精度要求的提高,研究人员提出的卷积神经网络模型结构越来越复杂,参数量和计算量迅速增长,卷积神经网络对处理器的计算性能和数据存储带宽要求也随之不断提高,传统的处理器已经难以满足其要求,促使处理器的架构
随着移动互联网的快速发展,社会对通信业务的需求呈爆发式增长,现代移动通信也在不断的演进发展。正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术因其抗多径衰落能力强、频谱效率高等优势被广泛应用于第四代、第五代无线通信系统的物理层标准,但OFDM技术因其对频偏敏感、带外泄露严重等系统固有缺陷无法很好的满足未来无线通信的应用需求。通用滤波多
近年来,国内零售行业发生深刻的变革,“新零售”成为发展趋势。2016年下半年开始,以阿里、腾讯为首互联网巨头纷纷携手传统商超进入“线上到家”时代。门店前置仓是线上业务到家服务的一个重要中转站,它承载了接单、拣货、客服、配送交接、备货、补货等多个流程,都需要在仓内完成,这些流程我们统称为前置仓履约。优化前置仓履约在提高到家业务的运作效率和服务水平方面有着重要的作用。前置仓履约包含的环节中,拣货是成本
随着社会信息化发展,越来越多大型公共场所比如商城、地铁、校园和住房小区等地方安装了大规模摄像头,形成了一个大型的实时视频监控网络。传统的视频分析采用人工查询处理视频信息需要耗费大量的人力物力资源,如何有效且快速处理监控视频成为一大难题。行人重识别作为视频监控网络中重要环节,受到越来越多的关注。现实复杂的环境中行人受到光照强度,行人姿态多变,运动遮挡等问题,导致采集的行人图像差异性较大,从而影响行人