多维度特征融合的侧扫声呐图像目标检测设计与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:oikikukka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
侧扫声呐图像目标检测在水下研究领域起着至关重要的作用。然而,声呐图像存在的复杂背景、严重噪声干扰和形状各异的多类别目标等问题会严重影响目标检测模型的性能。传统方法严重依赖人工特征,导致模型难以对声呐图像中的目标进行高效检测。近年来,日新月异的计算机视觉技术使深度学习得到高速发展,能够完成复杂检测任务,因此功能更为强大的深度学习更适合于侧扫声呐图像目标检测。本文基于对侧扫声呐图像特点与单阶段目标检测算法YOLOv3的分析研究,提出一种多维度特征融合的算法Improved YOLOv3,具体研究内容如下:首先,在特征融合部分,针对特征金字塔网络的单向信息传递问题,提出增加自底向上的路径形成双向特征融合,通过充分利用浅层特征,使模型能够更加清晰地学习到图像中具有的细节信息,增强网络融合不同层次特征的能力;并针对YOLOv3不注重局部特征的问题,提出使用最大池化将局部特征加入到全局特征中,能够赋予特征图更强的表达能力,优化网络对于同层次特征的融合。在损失函数部分,针对YOLOv3损失函数将原本具有联系的坐标信息与宽高信息分别进行不同类型计算的问题,提出引入基于IOU的损失函数,能够在信息之间建立起更完整的联系,达到优化模型训练过程的目的。其次,针对样本过少会影响训练效果的问题,提出使用Mosaic对图像进行数据增强,增加单张图片的丰富度;并使用dropblock正则化方法,以块的形式删除特征,能够更大程度覆盖目标,达到使特征在训练过程中不易被修正的目的;以及提出在骨干网络中使用Mish激活函数,将信息传播到更深的神经网络,从而训练出准确度更高的模型。本文通过多组实验对改进算法进行有效性验证,根据实验结果,证明改进算法能够得到更高的准确度和置信率、更准确的预测框尺寸和位置、有效去除重叠框、漏检目标被成功检出以及误检目标得到有效纠正,其准确度较YOLOv3提高了8.3%,从而为所依托的“水下敏捷机器人协同作业平台”项目提供侧扫声呐图像目标检测模型。
其他文献
我国是全球汽车生产和消费的第一大国,汽车已成为家家户户必备的交通出行工具之一。随着科学技术的发展和进步,汽车产品力不断提升,汽车方向盘作为汽车产品上用户直接接触与操控的重要部件,具有重要的创新设计与研究意义。本文通过对汽车方向盘进行解析,从造型与结构、CMF设计等角度分析汽车方向盘设计,介绍了未来概念汽车方向盘,叙述了汽车方向盘整体现状。探讨总结出人工智能技术的发展与介入,汽车座舱智能化和汽车网联
阅读是人类认知世界的窗口。绘本是教育界公认的儿童早期教育的最佳读物,儿童时期阅读经验和阅读习惯的养成对其一生的发展至关重要。图文并茂的绘本产生的“吸引力”是儿童阅读习惯养成的基础,实践验证绘本馆是儿童早期认识世界接受知识教育的重要场所之一,它不仅可以为儿童提供丰富的可读性绘本,其绘本馆的环境空间的合理营造也能增强孩子们的功能阅读收效。对于儿童绘本教育的社会化、规模化的发展及亲子关系的培养等问题,应
在我国经济发展水平日益提高,人民群众美好生活需求日益突出的时代背景下,为加快推进我国社会主义现代化进程,构建社会共同价值体系,我国提出建设新时代文明实践中心。然而,在实践过程中,新时代文明实践中心缺乏对于新时代文明实践中心建设工作的明晰定位,难以彰显新时代文明实践中心建设的社会意义。因此,本文采用案例研究法,以竹山县新时代文明实践中心作为研究案例,对其进行深入研究,以为其它新时代文明实践中心的建设
网络招聘是现阶段主流的招聘形式之一,发挥着连接求职者和招聘者的桥梁作用。人岗匹配是网络招聘中的一个重点研究问题。得益于自然语言处理技术的发展,已有人岗匹配研究大多基于岗位的岗位描述和求职者的工作经历这两个文本型特征建立模型。一方面,这些研究没有考虑到其他类型的文本数据,例如,职位子类和岗位浏览记录;另一方面,求职者的应聘过程是“浏览岗位→投递简历→招聘者是否认可”,已有研究没有考虑到求职者前序行为
目的分析维持性血液透析患者发生冠状动脉钙化(CAC)的发生及严重程度的相关危险因素。对象和方法(一)第一部分研究选取2018年1月~2020年12月在广东省人民医院维持性血液透析的178例患者,回顾性收集研究人群临床数据,利用ELISA法检测血清骨保护素(OPG)、血清核因子NF-κB受体活化因子配体(RANKL)、成纤维因子21(FGF21)水平,测定冠状动脉钙化积分(CACs),根据CACs值
水作为自然界中最普遍的灭火物,既经济又高效,所以对地面水体信息的精确提取以及确定扑救取水的道路网络,是及时开展森林火灾扑救,保证以水灭火有效实施的基础。目前传统的林火扑救取水方式通常情况下都是人为到现场勘定,不满足森林火灾扑救的安全、快捷、经济等要求,在这一背景下,如何快速、高效地提取水体信息并取水灭火成为当下林火研究的热点问题。研究以Sentinel-2数据为基础,基于随机森林算法,提出一种RF
近年来,我国城市交通压力急剧加大,现实中交通拥堵问题严重困扰着市民的日常生活,不仅导致市民出行的时间、经济成本增加,同时带来的汽车尾气也加剧了城市空气污染,广大市民感触深、积怨多。此外,交通拥堵也是导致道路交通事故的重要原因之一,这也严重威胁着市民的出行安全。自改革开放40年以来,城市的社会、经济、文化等综合实力得到迅猛的发展,截至2020年底,深圳市总人口已跃居到1756.01万人(位居广东省全
经济政策发布时间的未知性、新政策具体内容的未知性以及市场如何对新政策做出反映的未知性构成了一国经济政策不确定性全部内容。从2008年美国次贷危机波及全球到当下的新冠疫情在全球肆虐,国际金融市场正在经历着比过去几十年内更多的磨难,面对这些风险与挑战,各国政策制定者也积极施行各种经济政策来干涉和调控市场以稳定经济的运行。在这种背景下,政府部门对经济的干预比过去更加频繁、干预力度也大大增加,这种行为在很
文化和旅游的融合是推进我国供给侧结构性改革、实现产业转型迭代的重要途径,它起源于市场经济的发展,同时也离不开政府的有力参与。当前中国的文旅产业融合已作为一种强势新业态进入政策研究领域,政府在重大战略规划中多次涉及推进文旅融合的议题并为此进行了机构调整,将文化和旅游部门整合重组以专项负责文旅产业融合的引导服务工作,这标志着文旅融合发展进入新阶段。山东省是文化资源和旅游资源均极丰富的经济强省,发展文旅
话语标记是口语交际中所特有的一种语用机制,理解这种语用机制,有助于听话人准确地理解说话人的语用含义及交际意图,使交际内容更准确地传达,交际行为更有效地进行。本文选取了维吾尔语口语中使用频率较高的“boldi”作为研究对象,基于维吾尔语语料,对话语标记“boldi”进行甄别与判定,再从运用模式及分布情况进行考察;再次,对“boldi”受语境的影响而被凝固化产生的规约化意义进行了归纳及分类;最后,从语