论文部分内容阅读
视觉质量评价在各种多媒体应用中起到了关键性的作用。由于人类的视觉系统是视觉信号的最终接收体,故主观视觉质量评价被认为是最可靠的视觉质量评估方法。但是,主观视觉评估耗时且昂贵,因此,自动的、客观的视觉质量评估方法已经被开发并被应用于很多场合当中。然而最广泛使用的客观视觉质量度量方法,如均方误差(MSE)、峰值信噪比(PSNR)等与人眼对视觉信号质量的判断相距甚远。人类在分析视觉场景时,会迅速选择性地找到“重要的”或“感兴趣的”部分,对一副图像的不同位置分配不同的注意。因此本文根据视觉注意机制的选择性注意特点,建立了显著性模型来模拟人的视觉特性评价图像质量,使得图像的客观评价更接近于主观评价结果。 由于自底向上注意机制提取的低层特征难以有效描述图像的高层语义信息,本文采用人脸、行人、水平线和中心先验作为作为高层特征嵌入到自底向上的显著性模型中,提出一种语义嵌入的显著性检测方法,即将自底向上的低层特征与自项向下的高层语义特征进行有机的结合。实验结果表明,本文方法得到的显著图在包含语义对象的复杂场景中能够有效地预测人眼注视。 进一步采用建立的语义嵌入显著性模型对图像质量评价数据库TID2013进行统计分析,结果表明大多数情况下,参考图与失真图的显著图差异明显。故将显著图作为一个特征计算失真图像的的局部质量,而对于显著图结果差异不明显的失真类型17和18分别提取图像的梯度和颜色特征,最后采用支持向量回归加权各特征得到最终的评价测度。通过与其他9种代表性的质量评价方法的对比分析,结果表明,本文建立的评价方法能获得更高的预测精度,表明了本文方法评价的结果更加符合人眼的主观感受。