论文部分内容阅读
社会和技术的进步催生了一大批电子商务网站,它们的出现给人们带来了一种方便快捷的在线购物方式。电子商务的飞速发展使得商品图像急剧增加,如何对数目庞大的商品图像进行快速有效的管理,并给消费者提供方便准确的图像搜索服务是急需解决的技术难题。基于内容的图像分类技术能对商品图像进行自动分类管理,同时图像分类也可以看成是图像检索的一种方式,通过分类识别检索图像所属类别,并提供相似的商品。本文研究的主要内容如下: 首先通过对图像常见特征的学习研究,分析商品图像的特点选择合适的图像特征。实际商品图像常受背景噪音干扰,同时存在角度、尺寸和形状变化,而SIFT特征对旋转、尺寸伸缩和形变不敏感,但SIFT因特征数据量大不直接用于分类,因此使用视觉词袋模型对商品图像进行分类,并结合空间金字塔匹配技术弥补了常规视觉词袋模型忽略视觉词空间位置信息的缺陷,有效提高了分类性能。 考虑到不同特征描绘图像的侧重点不一样,不同分类器对同一特征的分类效果也有差异。本文研究利用特征融合的方法提高分类准确率,使用一种融合策略:将颜色分布直方图、LBP、HOG进行特征级融合得到新的向量作为图像底层特征表示,以视觉词袋特征作为图像中层特征表示,对底层、中层特征分别训练多个分类器,将输出结果进行决策级融合。实验表明该融合策略能有效提高商品图像分类的正确率。 最后将图像分类技术应用到广告推荐中,针对图像类型广告,通过分类识别网页中图像的类别,并与广告库中相同类别图像计算相似度,从中选出内容最相似的几张图像广告进行推荐。