论文部分内容阅读
计算机视觉是使用计算机或相关设备对生物视觉的一种模拟工程,它是一门研究让机器代替人眼对图像中的目标进行识别和检测以及跟踪等工作的科学学科。作为计算机视觉领域的分支之一,视觉显著性检测是指通过智能算法模拟人的视觉特点,提取图像中的显著区域。RGB-D图像显著目标检测旨在对一对RGB图像和深度图像中识别视觉上最显著的对象。在过去几十年里,学术界已经有大量的学者或团队研究并公开发表了多种RGB-D图像显著性检测算法,这些研究成果成效显著并推动该领域取得了迅猛进展,但其中尚存在部分算法,其检测准确率或者效率仍然有所欠缺。因此,本文基于现存的RGB-D显著图,考虑初始显著图的数量为单张或多张的情况,提出了应用于两种不同情形下的RGB-D显著图像的优化方法。近几年,机器学习被已经广泛应用到图像显著性检测领域并取得了巨大的成果,其关键点是通过利用人工标记的标签训练样本来训练一个分类模型。大量的训练样本直接影响着学习模型的性能。径向基函数(Radial Basis Function,RBF)网络能够逼近任意的非线性函数,可以处理系统内的难以解析的规律性,具有良好的泛化能力,并有很快的学习收敛速度,已成功应用于非线性函数逼近、数据分类、模式识别、信息处理、图像处理等。图像显著性检测工作本质上就是判断图像中各像素属于前景或背景的分类问题,由此,针对初始显著图像为单张的情况,本文首先提出了一种有效的基于RBF网络的RGB-D显著图像优化算法。此外,学术界已经提出了多种有效的单幅RGB-D图像显著性检测的方法,而这些检测方法之间存在着优势互补,因此,对各种方法生成的显著图进行融合以提高显著性检测精度的研究工作同样不可或缺。顾名思义,显著图融合工作,即融合由多种图像显著性检测方法生成的显著图以得到最终显著图。已有很多学者在该领域做过大量研究工作,并可以证明融合工作确实可以取得明显成效。因而,针对初始显著图像为多张的情况,本文提出了一种RGB-D显著图像的融合算法。本文主要研究工作有以下两点:1.本文提出了一种基于RBF模型的RGB-D显著图像优化算法。首先,将现有的RGB-D图像显著性检测算法生成的显著图视为弱显著图,即先验图,利用先验图可以从超像素中收集包含正负样本的训练集。其次,从输入的RGB图像和深度图像中提取四个特征描述符RGB、CIElab、局部二值模式(Local Binary Pattern,LBP)以及深度值DEPTH来进行丰富的特征表示,以此来学习一个强分类器RBF对超像素的特征向量和显著性值进行映射,再用经过训练的RBF网络模型预测所有测试样本的显著性,得到标签显著图。最后,为了进一步提高检测性能,融合多尺度的标签显著图,生成强显著图,再融合弱显著图和强显著图,得到最终的RGB-D图像显著性检测的结果。2.本文对RGB-D图像显著图进行融合,即在融合显著图的过程中,利用深度图进行影响。该算法分别在图像级别和像素级别两个层面上融合显著图。在图像级别上,设计了一种简单且有效的RGB-D显著图质量评估的特征——分割质量,并用该特征作为显著图的权重,在图像级别上进行线性融合。在像素级别上,考虑单个像素在不同显著图中的显著值差异,针对单个像素计算其显著相似性,将其作为该像素的权重,在像素级别上进行融合。最后,将这两个层面上得到的显著图按比例进行融合,得到最终的图像显著图。本文在公开数据集RGB-D1000上进行了对比实验,实验结果表明,这两种RGB-D显著图优化方法的效果均优于初始图像显著性检测的方法,且本文提出的显著图融合算法和其它的融合方法相比,也具有一定优势。