基于多尺度特征融合的目标检测算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:hubingguixuejing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的发展,目标检测技术的检测精度和速度不断被刷新。目前目标检测技术已被应用于生活的各个场景中,如:智能监控、智慧交通和无人驾驶等。然而目标的时空尺度变化仍然是检测中的难点,因此本文从多尺度特征的角度对这些问题展开了研究,利用空间多尺度特征研究了小目标难以检测的问题,在此基础上又研究了检测算法轻量化的问题,最后利用时间多尺度特征对视频目标检测中帧间信息的有效利用进行了研究。本文的具体研究工作如下:(1)针对小目标难以检测的问题,提出了基于局部感兴趣区域超分的空间多尺度特征融合算法。该算法提出基于浅层特征图的小目标预测分支以更好地获取小目标的位置信息;设计了特征连接模块对浅层特征图的特征信息进行增强;为了实现更准确的特征映射同时进一步的丰富小目标的特征信息,设计了基于感兴趣区域超分的多尺度特征融合模块。实验证明该算法对于检测模型的整体精度有提升,尤其对小目标的精度提升有明显效果。(2)为了检测算法的轻量化,提出了基于通道降维和注意力机制的检测算法。设计了通道降维模块对检测的特征图通道数进行压缩;为了避免通道压缩造成的精度损失,设计了注意力模块引导生成更关注前景区域的特征;同时算法还针对第二阶段检测网络的全连接层等结构做了进一步优化。实验证明本算法在检测速度和精度上均有一定的提升效果。同时将算法应用于(1)中网络结构,在检测速度上取得了一定的提升效果。(3)为了更好地利用视频目标检测中的时序特征,提出了基于时间多尺度特征融合的视频目标检测算法。利用光流引导的方式生成非关键帧特征。为了增强非关键帧的特征表示,利用动态规划的思想,设计了非稠密连接的特征融合方式,使用不同时间尺度的特征信息来丰富非关键帧特征。实验证明了本算法在检测精度上取得了一定的提升效果,在目标运动模糊、运动遮挡等场景下都有较好的检测表现。
其他文献
针对铁路货车的行车安全检测对于保证货车平稳运行至关重要,而轮对的安全状况是货车运行和运维过程中的重点关注问题。现阶段轮对踏面损伤检测在非营运状态下进行,检测速度慢、效率低、耗费大量人力物力,需要探索更为快速高效便捷的轮对踏面检测方法。本文围绕铁路货车轮对踏面损伤机理、温度场有限元仿真、运动模糊图像复原、图像特征提取等方面展开理论和实验研究。为检测出运动状态下轮对踏面的损伤情况,针对运动模糊红外图像
近年来,随着计算机和通信技术的迅速发展,现实生活场景中涌现了不同的时空众包平台,例如滴滴、美团外卖等。不同于传统的众包平台,时空众包平台在任务分配阶段需要获取众包工人的真实位置以实现有效的任务分配。由于大多数时空众包平台是不可信的,众包工人的位置信息容易泄露,导致工人不愿意参与任务分配。因此,在时空众包中保护工人的位置隐私显得尤为重要。除了工人位置外,任务位置在分配阶段也应被保护,因为众包平台可能
无人驾驶技术与云计算、人工智能等技术的深度融合,为智能交通领域的发展带来深刻的变化。无人驾驶的核心技术主要包括环境感知、定位与建图、规划与决策和智能控制等,而高精度地图是L4级及以上无人驾驶的核心技术。虽然国内外学者针对高精地图生成方法的研究取得丰硕的成果,但其过程仍存在自动化程度低、更新速度慢的问题。针对这一现状,论文针对基于3D点云的高精地图的环境图层自动生成问题,采用基于深度学习的点云语义分
近年来伴随着C-V2X(Cellular Vehicle to Everything)等车联网技术的快速发展,自动驾驶和智能驾驶等智能交通业务需求不断增加,催生了一系列延迟敏感型、计算密集型的车联网智能应用。云计算架构因为日渐拥塞的回程链路和距离用户过远导致的服务响应延迟而难以满足智能交通要求的高可靠低时延。移动边缘计算(Mobile Edge Computing,MEC)应运而生为新的技术应用范
随着信息技术迅速发展以及网络服务的普及,数据规模实现井喷式发展,社会逐步进入了信息化的大数据时代。作为解决信息过载的重要方法,推荐系统得到了迅速地发展,同时也在人类生产、生活的各个方面发挥着重要的作用。多行为推荐系统作为推荐系统的一个分支,虽然起步较晚,但是由于多行为数据的丰富性及应用场景的广泛性,近些年来多行为推荐系统也得到了社会各界人士的青睐。目前多行为推荐系统在如何合理利用行为之间多等级偏好
计算机断层成像(Computed Tomography,CT)因为具有无损、高分辨、没有重叠影像等诸多优点,被广泛应用于安检、医疗和工业等领域。通常,传统CT系统需要完全角度投影数据来进行图像重建。然而,由于实际条件的限制,有时无法获得完全角度投影数据,由此引出了有限角度投影数据CT图像重建问题。理论上,有限角图像重建问题是一个不适定的问题,且这种不适定性会随着缺失角度的增加而变得更加严重。因此,
随着科学技术的快速发展,海量数据充斥着人们的生活,信息过载问题日益严重。推荐系统逐渐成为人们获取个性化信息的有力工具,帮助人们在海量信息中获取有用信息,并且已经成功应用到各行各业。基于协同过滤的推荐方法通过利用用户和项目的行为数据来学习用户和项目的特征表示,逐渐成为主流的推荐方法。但是现实世界中用户-项目评分矩阵具有高度稀疏而且分布不均匀的特点,当推荐系统仅考虑用户和项目之间的评分矩阵信息时,其性
随着云计算、大数据、物联网等技术的飞速发展,互联网应用的种类层出不穷,引发了数据规模的爆炸式增长,也带来了严重的信息过载问题。作为解决“信息过载”的重要手段之一,推荐系统已经得到广泛应用。但是传统的推荐系统存在冷启动、用户-项目评分矩阵的极度稀疏性等问题。除了推荐系统的评分信息外,用户对项目的评论信息也包含了丰富的用户兴趣和项目特征信息,有助于更准确地学习用户和项目表示。近年来,将评论融入推荐模型
按照课程标准的要求,就核心内容来说,统编《道德与法治》九年级教材主要涉及国情部分。因为这一部分与初中学生的实际生活有一定距离,且涉及较多比较抽象的概念和政策,有不少教师在教学时往往觉得无从下手。有的教师则以保证科学性为由,采取照本宣科的教学方式,将本应生动活泼的道德与法治课变成了学生非常排斥的"训教与口号"课。如
期刊
在城市轨道交通飞速发展的今天,要保证列车安全运行,关键不仅在于对轨道交通系统中基础设施病害的及时检修,相关核心工作人员如列车司机的专业性和机动性也尤为重要。司机能否在列车到站、出发、关门等重要节点做出正确手势是衡量司机工作态度和质量的重要标准。不正确的手势判断将直接威胁列车运行安全,因此对司机手势动作的监控识别十分重要。然而目前该工作主要依赖人工完成,不仅效率低下,而且造成人力资源浪费。因此需基于