基于长尾分布数据集的目标检测算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:cnwan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的蓬勃发展,人工智能相关应用越来越多的出现在日常生活中。其中的代表性技术,如人脸识别,行人识别,车牌识别等,为人类生活创造了极大的便利。而在这些应用领域,目标检测算法扮演着重要角色。尽管现有的算法在类别较少的任务上达到了很高的精度,但是随着类别数目的增加,其性能会急剧恶化,无法应对自动驾驶、机器人巡检等复杂自然场景下的算法需求。通过对大规模多分类数据集LVIS的深入分析,本文认为数据集的长尾分布是制约多类别目标检测的主要瓶颈。长尾分布是指在训练集内的各个类别的数量极度不均衡而导致稀有类别欠拟合的现象。识别领域通常采用“重加权”和“重采样”解决此类问题。然而在检测任务中,实例与图片互相耦合,稀有类与背景难以区分,为稀有类的检出带来了更大挑战。本文在Faster RCNN的基础上,提出了新的损失函数和采样策略。损失函数方面,通过拆分前景-背景损失抑制了类间竞争,并进一步通过对稀有类的梯度保护和重加权提高训练时梯度占比;采样策略方面,首先通过Top K anchor提升RPN阶段稀有类锚框的样本数量,进而提高了稀有类区域提议的分数,随后通过自适应Io U阈值的RCNN采样提升了稀有类样本数量,配合实例优先的图像级别采样,有效提升了稀有类的精度。本文的实验基于LVIS数据集展开。与Faster RCNN相比,本文提出的方法在整体上有4.9%的mAP提升,对稀有类的mAP的提升更为明显,达到13.3%。在与同领域其他方法的对比中同样处于领先水平。进一步的实验证实,本实验在不同模型结构和训练设置下均取得了较好的效果,展现出良好的实用性和泛化性,为相关技术研究和实际应用提供了良好的范例。
其他文献
对电气柜进行接线检错是电气柜生产流程中的重要步骤,其检错精度与准确度决定了电气柜是否能够正常使用。传统的检错方法主要是通过检测人员人眼识别,采用颜色校准,位置检查
随着我国社会经济的不断发展,人民的生活水平不断提高,随之而来的环境问题也日益凸显,“垃圾围城”问题就是其中之一。自二十世纪九十年代以来,我国相关政府部门逐渐认识到通过垃圾分类实现源头减量和资源回收对于城市垃圾治理的重要性。在2000年6月,建设部城市建设司开启八个城市垃圾分类试点。如今20年过去,根据住房城乡建设部的统计,截至2020年1月3日,全国已有237个城市启动垃圾分类。《中国环境报》作为
研究活动星系核(active galactic nuclei;AGNs)在X射线波段的光变特性对于我们了解黑洞周围的物理现象具有重要意义。活动星系核X射线波段的光谱存在光变现象,并且在耀变体和
文言文记载着传统文化的发展轨迹,是传统文化的一种载体,也是我国传统文化象征。文言文虚词是文言文不可缺少的组成部分,对文言虚词进行研究,既有利于提高教师教授文言虚词的教学能力,也有利于学生更高效地学习文言虚词。可是,针对文言虚词的教学,既没有引起教师足够的重视,也没有引起学生过多的关注。多数师生只重视文言实词的学习,却忽略了文言文虚词的教学,以致于教学没有连惯性,学生学起来也没有层次性。直接后果导致
自2014年,“11超日债”违约事件的发生开始,我国债券市场的“刚性兑付”规则被打破。近两年,债券违约情况出现激增,2018年有165只债券发生违约,涉及金额1534.25亿元,同2017年上涨320.86%。2019年延续此趋势,累计有231只债券发生违约,涉及金额约2246.95亿元。通过对2019年新增违约主体的统计发现,民营上市公司债券违约情况多发。并且在这些发生违约的主体中,出现投资战略
为进一步应对气候变暖、缓解碳排放量和环境污染压力,满足有限区域范围内陆上或海上持续能源动力供应需求,拓展核能动力在偏远区域有限电力生产、海洋核动力平台、核动力破冰
视网膜作为人眼成像的关键部位,由色素上皮层和视网膜感觉层组成,紧贴在脉络膜内面。由于许多眼底疾病所引起的病变通常会表现在眼底血管之上,所以在临床医学上,获取视网膜图像通常是诊断眼底疾病和其他系统的疾病的重要环节之一。由于眼底照相机拍摄照片的角度有限,单幅图像所得的区域较小,难以获取有效的图像信息,因此,在医学研究领域或者临床诊断医学上,需要将多幅不同角度拍摄的视网膜图像拼接在一起,以此获得较为完整
随着气候变化和城市化进程的加快,短历时暴雨引发的城市内涝、小流域山洪灾害等问题亟待解决,严重威胁着人民的生命财产安全和经济社会发展。科学、合理、精确地编制暴雨公式
为了解决神经网络训练时的巨大资源消耗,MLaa S(机器学习即服务)正如Saa S(软件即服务),Paa S(平台即服务)和Iaa S(基础设施即服务)一样,已成为一种发展趋势。但伴随而来的是第三方提供服务的不可信问题:机器学习服务提供商可能由于遭受黑客攻击或受额外利益的诱惑而在其服务模型中部署木马后门,发布附带恶意功能的神经网络模型,即神经网络木马。当对这些被感染的模型输入带有特殊标记的样本时,
物联网的快速发展,给生产生活带来巨大便利。然而物联网设备受限于自身的计算能力、存储能力、网络带宽等因素,加上与之相配套的安全技术未能与其发展速度相适应,使得物联网中存在着大量易被攻击的不安全设备,存在着严重的安全隐患,最直观的体现便是物联网僵尸网络的泛滥,因此本文对物联网僵尸网络流量的检测进行了深入的研究。本文以网络流量分析和神经网络相关技术为基础,针对物联网僵尸网络检测中的数据处理、特征选择以及