论文部分内容阅读
语义分割是图像理解中至关重要的环节。为实现高质量的语义分割,通常需要解决两个问题:1)如何设计有效的特征表示来区分不同类别的对象;2)如何利用上下文信息来确保像素标签之间的一致性。针对这两个问题,本文在超像素分割、二维轮廓精确匹配与分析、基于超像素的图像层次语义分割等三个方面开展了研究,提出了相应的处理方法,并通过实验验证了所提方法的有效可行性。主要研究工作与成果包括:1.为实现精确、快速、更易于应用的超像素分割方法,本文提出了基于聚类的精到粗的超像素分割算法FCSS,通过引入具有物理意义的颜色阈值和深度阈值作为算法参数,实现了较少超像素数量下的高质量分割,既降低上层应用的复杂度,又为其提供易于理解的接口。BSD和NYU-Depth V2数据集上的实验结果表明,在超像素数量为100时,FCSS能获得较高的分割性能,优于现有主流算法。2.针对物体识别中轮廓精确匹配及部位识别问题,本文提出了一种基于最小点对成本的轮廓精确匹配与分析方法。通过结合原型知识库,引入粗到精二级匹配和最小点对成本精确匹配两种策略,进行轮廓匹配,其中,粗到精的二级匹配策略可有效降低匹配过程对轮廓细节变化的敏感性。MPEG-7和Animal数据集上的实验结果表明,所提方法在物体识别中的部位分割、轮廓识别和部位识别等方面是有效可行的,且均具有较高的正确率。3.语义分割作为图像理解的关键一步,其可理解性至关重要,针对该问题,本文提出了可解释的基于超像素的图像层次语义分割方法。首先,利用特征提取算法从数据集中构建出类别特征库。然后,通过超像素分割算法和超像素融合算法构建超像素层级树。最后,利用图模型对其进行解码推理获得最终类别标签。SiftFlow数据集上的实验结果证实了该策略的有效性,虽然其准确度不如深度学习方法高,但其具有可解释性和成长性等优点,是值得探究的一类方法。主要研究贡献:引入优先策略,在超像素分割算法和超像素融合算法的基础上构建出超像素层级树,提出了一种具有可解释性和成长性等优点的语义分割方法并通过实验验证了方法是有效可行的。