基于深度学习的多方向目标检测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhijie882008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域中的基础研究方向之一,其任务是找出图像中所有感兴趣物体,指明物体的位置与类别。相比于一般目标检测任务使用水平包围盒描述物体位置,多方向目标检测要求进一步指明物体的方向性。随着深度学习的发展,一般目标检测算法迎来巨大的进步,然而这种水平包围盒检测算法并不适用于检测具有明显方向属性的目标,例如遥感图像中的物体、场景文本等。精确地检测多方向目标能在城市规划、安防、车流量预测、自动阅读等领域发挥重要作用。现有的多方向目标检测算法通常都基于两种基本回归算法:顶点回归算法与旋转矩形回归算法,其回归目标分别为四边形包围盒的顶点坐标以及水平包围盒外加一个角度。两种算法均存在其固有问题:顶点回归算法需要显式地对顶点排序,无法反映真实情况下顶点无序的事实;旋转矩形回归算法需要将角度表示为一个区间,区间两个端点处差异较大,无法反映真实情况下角度周期变化的事实。该问题本质是:实际情况中的一种情形可能对应算法中回归目标的多种情形,形成“一对多”的回归目标歧义。该歧义一方面会使得算法在训练时回归目标混乱,造成训练困难;另一方面会使得算法在预测时,在歧义点附近的输出结果发生错误。针对回归目标歧义导致的训练困难问题,本文提出一种基于水平包围盒顶点滑动得到多方向包围盒的多方向目标检测算法。相比于顶点回归算法,其能有效减少出现歧义的回归目标数量,降低训练的难度,使得多方向目标的预测更加准确与稳定。针对算法在歧义点附近输出结果发生错误的问题,本文提出一种基于倾斜因子的分治策略。倾斜因子可以有效判断一个多方向物体是否处于歧义点,分治策略将根据该判断有针对性地输出结果,纠正歧义点附近的预测结果,最终实现任意角度目标的精确检测。最后,本文基于经典的Faster R-CNN通用检测算法框架上实现上述算法,在包含遥感图像目标检测、场景文本检测、鱼眼图像中行人检测三个领域在内的共五个数据集上进行实验,在未堆砌其他任何技巧的情况下,在所有数据集上都取得较高的精度与速度,证明了问题的普遍性、算法的简单高效性。同时本文对每一个组件都进行了详细的实验分析来证明其有效性。
其他文献
近年来,光动力疗法已经成为肿瘤治疗的一种有力手段。然而,光动力疗效却不尽如人意。大部分光敏剂在水中溶解性差,这在一定程度上限制了光敏剂的临床应用。此外,由于光动力疗法是一种局部治疗的方法,光敏剂需要递送到肿瘤部位,才能在肿瘤组织产生活性氧,从而对肿瘤进行杀伤。因此,光敏剂的溶解性和递送效率成为决定光动力治疗效果的两个关键因素。现如今,纳米药物由于能改善药物水溶性并提高药物靶向性,而被广泛应用于抗肿
外骨骼机器人能够修复和增强人体运动能力,在工业生产、康复医疗和军事作战等领域有着广泛的应用。为了通过人机协作辅助人体运动,外骨骼机器人需要在复杂的运动过程中检测人体运动状态和运动意图,从而降低人体自然运动代谢能耗。现有面向人体运动的测量方法,如肌电信号(EMG)、足底压力、关节转角等存在信噪比低、预处理复杂、实时性差等问题,导致运动状态识别难以满足外骨骼实时控制需求。肌肉形变信号具有信噪比高、预处
为了填补国际热核聚变试验堆ITER与示范聚变堆DEMO之间的科学技术断层,中国提出了中国聚变工程试验堆CFETR的设计与建造。现阶段,CFETR不同类型先进运行模式的初步设计已经完成。这些方案希望通过提升聚变等离子体整体的约束性能达到超过1GW的聚变功率以及超过10的聚变增益。等离子体约束性能主要由芯部湍流输运水平和台基区高度共同决定。等离子体的形状,特别是三角形变,从目前的研究结果来看,同时会对
升力滑翔式飞行器由于其自身的飞行速度快,射程远以及强大的机动突防能力,在未来战争之中具有非常重大的战略意义。升力滑翔式飞行器的再入轨迹优化与制导问题是航空航天领域的一个研究重点,同时也是一个难点,这主要是因为飞行器在再入大气层时面临的复杂约束条件以及自身的非线性运动学模型。本文针对升力滑翔式飞行器再入轨迹优化与制导问题,主要分以下几个方面开展研究工作。本文首先建立合适的坐标系,运用牛顿第二定律对升
伴随化石能源消耗产生的能源危机和环境污染问题成为当前世界面临的两大难题。为实现低碳排放,提高能源安全,开发利用可再生清洁能源势在必行。作为“减碳能手”的氢能,因具有热值高、能量密度大、来源丰富和产物无污染等特点,被视为21世纪最具发展潜力的清洁能源。迄今为止,工业制氢主要以蒸汽甲烷重组和煤气化为主,制备过程中消耗大量资源,制取的氢气纯度低,且产生大量污染物和高的碳排放量。电解水是一种有效环保制氢路
近年来,电气化在船舶、汽车、轨道交通等领域不断深入发展。交通电气化极大地重塑了现代交通系统的发展方向,也带来了一系列的问题和挑战。随着国家对船舶电力推进、新能源汽车和电气化轨道交通等领域的不断投入,对现有电力驱动系统的性能进行深度优化,具有重要的科研和应用价值。在电机侧,电气化交通场合的电压等级严重限制了电机系统功率等级的提升。通常可以采用多套绕组设计提高电机系统的功率等级,这就带来了多绕组电机的
数字经济与实体经济融合发展是经济高质量发展的重要动力。本文基于2011-2019年非金融类上市公司数据研究了数字经济发展对企业实体投资的影响,及其内在作用机制和潜在的异质性。研究发现,数字经济发展显著促进了企业实体投资,采用工具变量法和多期DID方法处理可能的内生性问题后,这一结论依然成立。数字经济发展能够缓解企业融资约束、提升企业内部治理质量、提供更多的投资机会,进而提升企业实体投资规模。异质性
目的:来源于自然环境和人类生产生活中的金属/类金属,通过多种途径进入人体,对人体健康产生复杂的影响。然而,目前的大多数研究多关注单一金属暴露与死亡风险的关联,关于多种金属/类金属暴露与死亡风险的研究较为缺乏。因此,本研究基于东风-同济队列开展前瞻性的研究,探究多种血浆金属/类金属浓度与全死因和心血管疾病死亡风险之间的关联。方法:本研究选取了基于东风-同济队列的三个巢式病例对照研究中6155名研究对
随着CMOS集成电路工艺已经来到5nm技术节点,传统的Si基MOSFET的特征尺寸和器件结构已经达到了它们的理论物理极限,从而限制了CMOS集成电路向高性能、高集成度方向的发展。为了满足MOSFET特征尺寸按等比例缩小的需求,同时克服小尺寸效应引起的一系列影响器件性能的障碍,需要从衬底材料、栅介质材料以及器件结构这三方面去打破传统技术的瓶颈。Ga As由于其具有高的电子迁移率和大的带隙宽度,并具有
第一部分7,8-二羟基黄酮通过激活BDNF/Trk B信号通路保护视网膜神经节细胞免受慢性间歇性缺氧诱导的氧化应激损伤【背景】慢性间歇性缺氧(chronic intermittent hypoxia,CIH)在阻塞性睡眠呼吸暂停(obstructive sleep apnea,OSA)并发症中起关键作用,而OSA与视网膜和视神经疾病密切相关。此外,脑源性神经营养因子(brain-derived n