论文部分内容阅读
随着人们生活步入智能化和信息化时代,移动摄像设备在日常生活中逐渐普及,图像获取工具的增多,使得图像的获取更加简单便捷,同时也导致图像数据量迅速增大。近年来,用以描述图像的视觉特征多种多样,如何有效利用图像多个视觉特征之间的关系来提高海量图像的聚类质量,成为当前图像聚类算法研究的热点和难点。近年来,能够处理图像多个特征的聚类算法可划分为聚类融合和多视角聚类两类。其中,聚类融合算法首先获得数据的多个聚类划分,之后使用融合函数对已有的聚类划分再次聚类,得到优于原来聚类划分的结果。由于聚类融合算法过度依赖基聚类而忽略了图像数据的原始特征,当基聚类的质量不够好时,聚类融合算法无法得到高质量的聚类结果。多视角聚类算法可以直接处理图像数据的多个视觉特征,也即不同视角的图像数据,通过关联图像数据的多个视觉特征,获得比单个视觉特征更好的聚类结果。当图像的多个视觉特征呈现为高维时,多视角聚类算法存在维度灾难的问题。针对上述问题,本文提出了一种新颖的基于图像视觉上下文的多元IB聚类算法(Visual Contextual-Information Bottleneck,简称VC-IB)。该算法把数据分析视为数据压缩过程,在数据压缩过程中随机选取图像多个特征中的一种作为图像的主信息,其余视觉特征得到的聚类划分作为视觉上下文信息。VC-IB算法通过综合考虑图像主信息及其视觉上下文信息之间的关系,挖掘出图像数据集中的潜在模式,该方法能够同时借鉴聚类融合和多视角聚类算法的优点。VC-IB算法采用两个贝叶斯网络来刻画数据压缩和信息保留之间的关系,使用“提取-合并”策略对该算法的目标函数进行优化,并用互信息来度量图像主信息及其视觉上下文信息之间的关系。在五个图像数据集上的实验表明,该算法可以有效处理图像的视觉上下文信息,其性能优于经典聚类算法、聚类融合算法和多视角聚类算法。