基于字典学习的单幅图像层次关系提取

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:nightcatwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从单幅图像中提取其中的层次关系是实现图像分析的基础,也是深层次图像信息提取问题的基础。该研究的运用面很广,可以应用到图片理解(目标识别、姿态估计)、机器人视觉(运动分析和视觉跟踪等领域)以及三维立体重建等领域。因此单幅图像的层次关系提取是计算机视觉领域研究的一个重要课题。本文的工作可以分为两个大的问题:(1)获取图像区域的局部深度次序关系。(2)将得到的局部深度次序关系进行整合得到全局深度次序关系。本文通过字典学习来进行图像的局部深度次序推理。对于学习型分类问题而言,特征的提取相当重要。遮挡边缘的特征除了包括遮挡边缘的强度信息,也包括遮挡边缘两侧区域的颜色和信息纹理信息的差异。本文综合了大量的遮挡边缘特征,确保了特征提取的丰富性。本文创造性地将基于Fisher指标的稀疏分类器的方法引入到遮挡边缘的分类问题中,从而得到准确的遮挡边缘。首先对训练集进行遮挡边缘特征提取,来训练一个FDDL(Fisher Discriminative Dictionary Learning)遮挡边缘分类器。之后,将该遮挡边缘分类器对从测试集提取的边缘特征进行分类,从而得到训练集的遮挡边缘。之后,通过对遮挡边缘周围区域的T角点检测以及凹凸性对各个相邻遮挡区域的前后关系进行判定。至此,就可以获得图像的局部次序。在整合局部深度次序关系为全局深度次序关系中,使用了马尔可夫随机场的思想。通过把所有获得的局部次序,转换为图模型中的顶点和边,将获取的各个区域表示为图中的顶点,将获取的局部深度关系转化为图中的边,并使用马尔科夫模型来去除图中的环。这样,就将图中的全局深度次序推理问题转化为求解图的有效路径的问题。本文采用了 NYU V2深度数据集和Cornell深度次序数据集和这两个数据集,将其中的一半作为训练集,另一半作为测试集。实验结果表明,本文提出的算法框架具有很好的效果。
其他文献
高效视频编码H.265/HEVC(High Efficiency Video Coding)是基于图像块的变换编码,由于变换系数的粗量化而产生严重的块效应和振铃效应,严重的影响了观看者的视觉体验。为了提
互联网技术的飞速发展,使得整个人类社会成为了一个地球村。但是现有的语言却将不同种族与地域的人割裂开来,成为了人类沟通的障碍,世界迫切呼唤新的语言出现。符号因其简单
为解决生产装置中出现的手动控制频繁、系统稳定性不高、自控率低等问题,专家学者们提出了许多先进控制技术,但是这些技术多数是需要基于精确对象数学模型的。系统辨识就是通
随着互联网内容的复杂化,传统的一些匹配方法已逐渐无法满足识别出网络数据流中关键字间的逻辑含义的需求。同时,随着互联网内容的膨胀,对于大量数据的快速匹配需求越来越强
广义频分复用(GFDM)技术是为了应对第5代移动通信的高标准而提出的新型多载波传输技术。GFDM系统使用了非矩形脉冲成形技术,具有带外辐射低、频谱效率高、灵活性好等优点。但
随着系统控制精度的不断提高,非线性系统抗干扰问题变得越来越重要。滑模控制方法由于其优越的鲁棒性在处理干扰的问题中一直备受关注。传统的滑模控制方法对匹配的干扰具有
村民理事会是伴随着行政管理体制改革的不断深入以及乡村振兴建设的需要应运而生的新兴乡村群众自治组织,在新时代农村基层治理中日益发挥着重要的作用。在参与乡村管理的过程中,村民理事会发挥的管理功能、监督功能、文化教育功能,是乡村治理能力水平提升的一个侧面反映。同时,在改善党群关系与干群关系、推动基层民主政治建设、提升村民自治水平等方面发挥了积极作用。目前,村民理事会运行中尚面临诸多困难,包括缺乏必要的资
随着互联网的高速发展,监控告警系统作为大型运维管理的核心一环,不但可以实现对互联网中网络设备的系统性能和信息安全的实时监控与告警,而且还能够对安全事件和安全告警行
近年来城市各类灾害频发,对城市发展产生了较大负面影响,如何提高城市系统面对灾害事件的响应与适应能力是当前国内外城市领域研究的热点问题。以往的城市安全与防灾理念已不能达到现有城市发展的需求,而韧性城市理念从动态与发展的角度为城市灾害的应对开辟了新的道路。因此,提升城市韧性成为城市灾害治理新的发展趋势。随着社会城市的发展,燃气在人们的生产生活中得到了广泛应用,由于燃气的特殊性和危险性,随之而来的是日益
随着科技的发展,电离层对卫星导航、无线电通信、广播、空间探测等人类活动的影响越来越显著。因此,电离层的探测技术也越来越重要。非相干散射雷达具有时空分辨率高、覆盖空