论文部分内容阅读
在各种人类视觉感知模型中,Itti提出的模型运用差分高斯函数模拟人眼的感受野,得到颜色、亮度、方向三个注意分量的多个显著图,对这些显著图运用胜者为王(Winner Take All WTA)的神经网络得到感兴趣区域。该模型在自然图像中对物体的视觉注意有较好的效果,在科研、军事上有一定的应用。但是,该模型里面忽略了物体轮廓信息。对人眼的各项研究表明,人眼对物体的边缘轮廓的识别能力相当的高,增加物体轮廓信息,可望提高视觉注意的精确度。由此,本文在Itti模型的基础上提出了如下两点的改进:1、在Itti模型后端增加一个轮廓信息提取的模块。先用Itti模型寻找多个感兴趣区域,然后对区域进行适当的扩大,再采用改进后适合提取自然图像的轮廓边缘检测算子获得轮廓信息,模拟人眼系统的感受野通过轮廓信息确定感兴趣区域。由于物体相对于背景一般来说是有较大区别的,因此,物体一般都有一个较为完整的轮廓,对轮廓运用视觉注意,就能得到对人眼来说更准确的感兴趣区域。2、对Itti模型采用的高斯金字塔模块进行改进,以保留轮廓信息。改进后的高斯金字塔的高斯核窗口能根据图像的平坦状况,自适应地改变窗口的方向、大小和形状。在图像边缘的地方,窗口平行于边缘,并且窗口平行于边缘的高斯核边较长,同时垂直于边缘的高斯核边较短,这样能很好的保留轮廓信息。试验证明,改进后的模型能在增加计算量不是很大的情况下,提高感兴趣区域提取的准确度。对于亮度低、颜色与背景区别不大、方向信息不强,但一定轮廓的自然目标,本文模型正确识别力更强。最后,用改进模型实现了无人工参与的ROI(Region of Interest)嵌入式图像压缩处理应用试验。输入图像先经过5-3小波线性变换,再用本文模型得到的注意区域作为ROI掩模区域,最后用SPIHT(分层树集合分裂算法Set Partitioning in Hierarchical Trees)对小波系数进行分类排序的嵌入式图像编码方法完成了ROI图像编码。该模型无需人工干预,就能确定注意区域,实现对感兴趣区域编码的功能。