【摘 要】
:
边缘检测是图像处理和计算机视觉领域的一项基本任务,在图像识别、目标检测、图像分割以及医学图像分析等领域有着重要的应用前景和价值。它的目标是从自然图像的像素众多差异中找出视觉感知上显著存在的差异;重点和难点是在排除图像复杂纹理带来干扰的情况下保留图像的主要结构。尽管在边缘检测的研究历程中,研究人员提出了很多具有代表性的边缘检测算法,但是依然存在着一些不足之处。例如现有基于深度学习的算法预测的边缘质量
论文部分内容阅读
边缘检测是图像处理和计算机视觉领域的一项基本任务,在图像识别、目标检测、图像分割以及医学图像分析等领域有着重要的应用前景和价值。它的目标是从自然图像的像素众多差异中找出视觉感知上显著存在的差异;重点和难点是在排除图像复杂纹理带来干扰的情况下保留图像的主要结构。尽管在边缘检测的研究历程中,研究人员提出了很多具有代表性的边缘检测算法,但是依然存在着一些不足之处。例如现有基于深度学习的算法预测的边缘质量普遍较低,边缘附近存在大量的假边缘导致边缘过于模糊,需要依赖非极大值抑制的后处理进行边缘细化。本文从以下两个方面展开了对边缘检测算法的深度研究:一、为了解决现有网络结构与边缘检测任务不匹配导致检测的边缘质量较低的问题,本文提出了基于由粗到细策略的两阶段图像边缘检测网络算法,主要贡献如下:(1)通过数据分析我们发现图像不同位置的非边缘像素的分类难度是不同的,越靠近边缘分类难度越大。基于此本文提出了一种由粗到细的两阶段边缘检测思想,将传统的二分类边缘检测任务细化为边缘点、靠近边缘点、远离边缘点的三分类任务。结合该思想我们设计了一个由粗到细的两阶段W-Net边缘检测网络以及与之相结合的多权重交叉熵损失函数。实验结果表明,我们的算法在BSDS500数据集上的ODS指标达到了0.835,远超其他算法,并且预测结果的边缘质量得到了大幅度提升,边缘细化程度极高,且具有良好的泛化能力。(2)通过观察可以发现预测的边缘附近存在大量摇摆点,这些摇摆点虽然不会影响指标,但是会导致预测结果的可视化结果变差。基于此本文提出无监督的信息熵损失函数,用于抑制摇摆点,提高预测结果的可视化效果和图像质量。实验结果表明,在BSDS500数据集上的ODS指标由0.835上升至0.841,图像的可视化效果有了明显的改善,摇摆点数量大幅降低。(3)本文提出了一种全新的BSDS500数据集标签处理方法。与现有的方法直接将超过两个标注员标注的结果认定为边缘点不同,我们认为每一位标注员标注的结果都是有价值的,因此我们将超过两人标注的结果作为基准,用于矫正每一个标注人员的标注结果。实验证明,相较于DSCD算法的标签处理方法,我们的方法在BSDS500的ODS指标从0.823提高到0.835,OIS指标从0.825提高到0.847,算法性能得到了提升。二、为了解决现有研究对于边缘的认识不准确导致边缘建模错误以及现有的人工标注的边缘数据集普遍存在错误标注、标注偏移等问题,本文提出了基于邻接边缘模型的抗纹理干扰图像边缘检测算法,主要贡献如下:(1)为了解决边缘认识不准确的问题,本文提出了邻接边缘的概念,边缘像素点由不同类纹理的相接触的最外一层像素点构成,这种相接触扩展到八邻域内不会出现两个不同类的非边缘像素点相接触。我们在邻接边缘的基础上进一步提出邻接约束用于提高边缘的连续性以及边缘质量。实验表明,使用邻接边缘可以有效提高边缘检测的泛化能力,在跨数据集测试BSDS500数据集时ODS达到了0.736,并且预测结果的图像质量、边缘连续性以及边缘的细化程度得到大幅改善,对于纹理更加敏感,可以很好的抑制纹理线条带来的干扰。(2)为了解决现有人工标注的边缘数据集存在错误的问题,本文在提出的邻接边缘的基础上使用计算机合成了邻接纹理合成数据集,由于该数据集完全由计算机合成的,因此不存在由于人为主观臆断等因素导致的边缘标注偏移、缺失、错误标注等问题,训练数据的准确性得到了保障。实验数据表明,本文算法在纹理合成数据集上的测试的ODS指标达到0.978,PSNR达到28.529d B,SSIM达到0.990,远超其他算法在该数据集上的指标,并且通过用户调查,在跨数据测试的情况下,我们的预测结果更受用户欢迎,用户接受度达到70.7%。除此之外,对于本文算法在BSDS500等数据集上的测试结果和人工标注的对比中,有半数的用户认为我们的结果比人工标注的更加准确。综上所属,该数据集完全可以代替现有的人工标注数据集。
其他文献
我国庞大的流动人口一直以来向经济更为发达的大城市流动的倾向较为明显。然而,中国户籍制度改革的渐进性特征,在某种程度上为人口的自由流动增添壁垒,两者之间因此产生了矛盾。在一定程度上我们认为,劳动者向大城市流动是因为他们预期能够通过向大城市流动来提高自己的就业质量。宏观层面上讲,流动人口对经济发展做出的贡献已经得到多数学者的肯定,本文要解决的问题是,从个人层面来说,是不是大城市的流动人口就业质量就更好
Trade is an exchange of goods and services for another;when it takes place across countries,we call it international trade.Some underdeveloped countries are unable to use their mineral resources,so In
Logistics i.e.handling and storage of products is the key to the supply chain and business efficiency.If the benefits of a longer supply chain outweigh the costs,developing more advanced logistics sol
人工智能中一个很重要的组成部分——知识图谱,能将互联网中海量的信息进行有秩序地组织、管理与理解。通用的知识图谱结构是以三元组(实体1、关系、实体2)的形式表示,如何对知识图谱的知识进行更好的表示,使得计算效率与可操作性不断提升,是对知识图谱的整体质量提出的高层次要求。知识图谱表示学习方法旨在将知识图谱的实体与关系表示为低维、稠密的向量,并用于高效的语义计算,在知识图谱的构建、融合以及其他方面发挥重
道线检测在车道偏离预警、自动驾驶等领域具有重要的作用。传统的道线检测根据特定的场景进行道路特征提取,因此在一定程度上难以应对复杂多变的道路环境。随着深度学习技术的快速发展,越来越多的研究者致力于面向深度学习的道线检测技术,拓展了道线检测的研究进程。本文利用深度学习技术分别对基于图像和基于视频的道线检测技术进行了研究,包括:(1)基于图像的道线检测技术。首先,通过聚类分析和人工标注的方式对公开的道线
随着新兴技术不断革新,多源图像方向上的处理技术也越发成熟,在军事、医学图像、监控等方面受到广泛的关注和研究。一般单个传感器捕获的信息在一定程度上已经无法满足我们应用的需求,其具体体现在实用性差、可靠性低。将多个传感器结合,补全其中的不足,构建更加全面的图像系统。考虑到不同图像间的差异,本文将红外与可见光图像融合作为研究案例,针对同一环境下两幅图像,采用融合算法对图像进行融合,融合图像兼具红外与可见
图像去雾旨在去除场景雾霾的同时,保留图像内容,提高图像物体的可见性。图像去雾是图像增强中的一项任务,往往作为其他高级图像视觉任务的预处理步骤,并且在自动驾驶,物体检测等领域有着重要的实际应用价值。在过去的研究中,图像去雾算法发展迅速,获得了良好的去雾结果,但同时也面临一系列问题。本文将针对这些问题展开深入研究,分为以下三个方面:(1)针对现有的雾霾数据集存在基准图像不清晰、残留雾霾、含有噪声,合成
随着大数据时代的到来,数据流在很多领域得到应用,作为数据挖掘领域的一大分支,数据流聚类成为一项意义深远而且具有挑战性的任务。现实生活中大部分数据流都是混合属性数据,然而大多数算法都是建立在只有数值属性数据或者只有分类属性数据的基础上。此外数据流的高维、海量、动态、快速等特性对数据流聚类提出了更高的要求。因此,建立高效的混合属性数据流聚类算法,是当前数据流挖掘领域的一个重要任务。为了能用较少的执行时
抗生素作为生长促进剂、细菌性疾病治疗药物被广泛用于畜禽业中,由于抗生素的乱用及滥用,细菌耐药基因产生,并可通过食物链传递至人体。本课题旨在研究家禽屠宰场中肉鸭和蛋鸭的抗生素耐药情况,并探讨质粒介导的喹诺酮类耐药基因qnrB的水平传播机制。(1)分别采集屠宰场待宰区中蛋鸭和肉鸭的粪便混合样及污水混合样,通过宏基因组测序从整体角度对肉鸭源样品和蛋鸭源样品的微生物结构及微生物耐药性进行分析。在微生物结构