论文部分内容阅读
相关反馈技术在提高图像检索性能方面发挥着重要作用。但图像检索过程中的相关反馈存在反馈次数过多,反馈效果不够理想等问题。贝叶斯分类算法多数会受到小样本问题制约,而支持向量机(Support Vector Machine,SVM)和贝叶斯分类都会受训练样本不对称问题的影响。如何克服这些问题,对提高检索效果至关重要。为解决上述问题,提出一种贝叶斯和支持向量机相结合的反馈算法,并在该算法基础上提出两种改进算法。在介绍结合算法之前,本文对基于SVM和贝叶斯的反馈算法进行了研究,为结合算法的提出做好了铺垫。该结合算法用贝叶斯分类器对图像库进行分类,聚集相关的图像,去除无关的图像,实现图像库的压缩,然后用SVM分类器对缩小之后的图像库反馈,从而缩小了算法的搜索范围,减少了反馈次数,提高了反馈效果,从而解决了反馈次数过多问题。而本文对小样本问题和训练样本不对称问题也有帮助。首先,虽然检索开始的时候贝叶斯分类器的训练样本有限,但随着反馈次数增加,用户标注的样本数增加,训练样本逐渐累加,样本个数逐渐增多,贝叶斯分类器效果会变好;其次,本文算法中的贝叶斯分类器的参数不是固定的,它随着样本数的改变更新自身的参数,所以每次反馈用的贝叶斯分类器都不同,这样构造的贝叶斯分类器会更合理,效果会更好;最后,反馈过程中用户标注的是前K幅图像,只标注相关图像,剩下的为不相关图像,而不是把图像库中所有未标注的图像作为不相关图像,所以基本不可能产生训练样本不对称问题。研究结果表明,跟传统和改进的支持向量机算法以及贝叶斯算法相比,在很少的反馈次数下,该方法明显提高了反馈效果。基于该算法的两种改进算法明显好于该方法。