论文部分内容阅读
近些年来,随着数码摄像机、图片扫描仪特别是带有拍照功能的智能手机等图像获取设备的广泛普及,人们获取数字图像的方式越来越多样和便捷。而计算机网络通信技术的快速发展和大容量存储设备的不断更新更使得数字图像资源呈现爆炸性增长。如何对包含大量图像的图像集进行高效智能的分析和处理成为国内外相关领域内研究者的重要课题。同一图像集中的多个图像之间通常存在着一定的关联,有效地量化和利用这种关联性是图像集分析和处理技术研究的一个重要切入点。本文从这一切入点出发,分别就图像集中图像的识别、共同视觉模式发现、多图像的前背景协同分割及协同抠图等问题展开研究,在探索多图像之间互信息挖掘方法的同时,重点考察如何利用这种相关性提高图像集分析和处理的能力和效率。具体来说,本文工作主要包括以下几个方面:(1)融合多图像关联性的图像识别方法。给定一个图像库和待识别的目标图像,现有的图像识别技术通常先提取图像库中所有图像的局部特征,建立“词袋”(Bag-of-Words)模型并将图像库中各图像及目标图像量化为标识向量,通过比对标识向量实现识别。该方法忽视了图像库中包含同类物体的多图像之间局部特征的关联性。本文通过对训练图像集进行局部特征的匹配建立特征之间的关联,在此基础上优化图像库中的特征,提高特征的判别力,并在构建词典的聚类过程中加入局部特征的关联性约束,使得具有匹配关系的特征在聚类过程中所属聚类保持一致,从而有效提高了词袋模型的准确度及图像识别的性能。(2)基于非线性均值漂移聚类的共同视觉模式发现算法。该工作的目标是自动标识两幅图像中所包含相同或相似的共同物体。实际研究中该目标被转化为如何正确匹配目标图像对的局部特征并将匹配对分组,使得同一组的匹配对对应同一个物体。本文提出一种基于均值漂移聚类(Mean Shift Clustering)的共同视觉模式发现算法,算法首先提取两幅图像的局部特征,构建初始匹配对集合并估算各匹配对的几何变换形成变换参数空间,进而采用基于均值漂移的聚类算法识别空间中密度较大的簇及正确的特征匹配对。方法的有效性在于系属同一物体的正确匹配对所对应的变换相近,它们在变换空间中的距离也相对较近,形成了密度较大的簇;采用基于概率密度分布的均值漂移聚类算法可以有效定位这种簇,进而标定共同物体的特征匹配对。该算法也是一种多图像之间关联的构建方法,实验中将该方法应用于图像检索,取得了较好的检索性能。(3)样本图像驱动的图像集前背景协同分割方法。算法利用已分割样本图像与待分割图像的相关性,基于学习的方法传播样本图像的分割信息并指导实现目标图像的自动分割,进而交互优化错误分割实现整个图像集的精确分割。实验表明,与一般的联合分割算法相比,该方法能更好更快地实现图像集的自动前背景分割;与逐个交互分割相比,算法能在极大减少所需用户交互量的基础上实现对整个图像集的精确分割,有效减轻了用户负担。(4)基于抠图置信度的图像集协同抠图算法。提出一种对包含相同前景但不同背景的多个图像进行协同抠图的算法,其目标是基于多图像之间的相关性,利用个别图像中抠图难度较小的局部区域指导优化其他图像中抠图难度较大的对应区域的抠图效果。算法中抠图难度的大小采用基于学习的方法估算得到,多图像间的对应关联由基于不同图像中像素间局部表征一致性及多像素拓扑关系的不变性约束优化建立。二者被融合在一个全局能量方程中并最终优化求解实现协同抠图。实验表明该方法能有效减少用户交互量并提高图像集的抠图效率和质量,为后续的抠图研究提供较好的借鉴意义。