在小型对象的SSD中实现多层功能融合

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:donny_zhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SSD(Single-Shot MultiBox Detector)是一种流行的目标检测方法。目前,利用卷积神经网络进行目标检测占据主导地位。然而,卷积神经网络在结构上存在固有的问题:高层网络接受域大,语义信息表示能力强,但分辨率低,几何细节信息弱。低层网络的接收场相对较小,具有较强的几何细节信息表示能力。虽然分辨率越高,但语义信息表达能力越弱。SSD利用多尺度特征映射预测目标,同时利用接收场大的高层次特征信息预测大目标,对低层次特征信息的低接收场预测小目标。这就带来了一个问题:在利用低级网络特征信息预测小目标时,由于缺乏高级语义特征,SSD对小目标的检测效果较差。本文在分析和介绍经典的SSD算法的基础上,以快速检测小目标为目标,提出了一种基于精度与速度权衡的单点多盒探测器(SSD)的基本结构。为了提高对小目标的识别精度,提出了一种多层次特征融合的MSSD方法。具体来说,融合操作分为两个特征融合模块,级联模块和元素求和模块,在添加上下文信息的方式上有所不同。MSSD训练采用VGG16和深残差网络优化候选盒回归和分类任务输入特征映射,提高检测精度和检测速度。在残差网络的基础上,本文采用基于FPN的网络体系结构,对传统的采样结构进行了改进。将高层语义信息集成到底层网络特征信息中,丰富了预测回归定位框和分类任务输入的多尺度特征映射,提高了检测精度。在logo和VOC2007/2012数据集上进行了实验,这些数据集包含大量的小对象(50像素或更少的对象)。实验结果表明,这两个融合模块在PASCAL VOC2007和Logo数据集上的映射效果都优于基准SSD,特别是在一些小目标类别上。
其他文献
随着国家改革开放和经济的发展,人们对于外汇的需求不断加强。国家对于外汇有着严格的管理和限制,但是也存在一些个人借用他人额度通过化整为零的分拆方式违规实现资金的跨境流动现象。这严重的违反了国家对于个人外汇支出的管理办法。因此,需要及时掌握外汇的分拆量和交易业务量的发展情况,以做出相应措施。为此,我们首先对预测模型的算法做出研究,并根据历史数据为基础,建立预测模型,对我们所提出的预测模型进行校验,以验
由于代码自动生成与补全可以极大地减少程序员的工作量,并且提高了软件开发效率,所以代码自动生成与补全成为当前研究热点之一。目前主流的软件集成开发环境和部分代码自动生成工具虽然在一定程度上实现了代码自动生成的功能,但是它们一般是无法根据编程人员的需求进行正确和高效的代码自动生成与补全,所以对代码自动生成与补全进行度量,对改进代码自动生成技术和提高代码自动生成与补全的质量和效率具有非常重要的意义。现有国
随着科技的发展,机器人行业有了巨大的发展。近几年,对于模块化软体机械臂的研究是机器人领域的热门。本文主要针对模块化软体机机械臂的设计,利用旋量理论进行运动学建模、形状记忆合金(SMA)热力学分析、利用拉格朗日动力学公式进行动力学建模、并进行动力学实验验证。本文的主要研究内容及工作如下:首先,利用三维软件建立三维模型,利用工业级SLA打印机打印三维模型,进行各个零件之间的装配与实验平台的搭建。通过相
“大众创业、万众创新”以来,我国的创业热潮不断提升。然而,因资源匮乏、企业流程不完善、难以获得利益相关者认可等因素,初创企业存活率普遍偏低。如何让初创企业更好地生存、发展进而取得成功,不仅意义重大,也是一项充满挑战性的任务。而导致初创企业失败的主要原因之一是初创企业面临的“新创弱性”带来的合法性挑战。如何克服这一挑战进而实现创业生存和成长,成为国内外学者关注的重点。近年来,结合创业领域的相关研究视
工作旺盛感指的是个人能够在工作的过程中同时感受与体验到“活力”和“学习”的状态。工作中的个人成长整合模型认为,工作中的情境因素可以通过满足个人的心理需要(归属感和胜任感等),进而促进个人工作活力的增加和学习状态的改善。基于工作中个人成长的整合模型,本研究采用问卷调查法,选取了来自全国300名社会工作者作为研究对象,详细分析了当前我国社会工作者的工作旺盛感现状、不同群体的工作旺盛感差异、工作旺盛感的
随着我国经济形势的转变和能源产业链调整的推进,煤炭行业开始出现供过于求的局面,煤炭企业才刚刚开始遇到更加激烈的市场需求。尤其是当前状态下,特别是在中美贸易摩擦和经济发展以及经济下行压力的情况下,中国的煤炭需求增长相对缓慢,煤炭企业市场经济竞争中退出参与的壁垒及附带条件较高,煤矿快速扩张的惯性力很大。生产能力使煤炭市场起伏很大,煤炭销售的压力开始逐渐增加,销售市场发生了很大变化。此外,替代煤炭的新类
科学技术的发展使得互联网在经济生活中的重要性日益提升,作为互联网信息的主要载体和主要表现形式,多媒体也得到了充分的发展与应用。在这一过程中,借助多媒体传输技术构建的多媒体传输系统也备受关注。多媒体传输系统大量应用于重要场所和远程区域的监视和控制。目前常见的无线多媒体传输系统主要基于移动通信网和无线局域网等需要基础网络设施的传统网络架构。这些架构普遍安装不便,成本较高,且大多数设备工作在2.4GHz
光电成像设备的应用场景越来越复杂,对于成像系统探测识别的远距高速、视场、分辨率等要求越来越高,传统成像系统已经不能满足当前的应用需求。具有大视场、小体积、高灵敏度等特点的仿生复眼系统开始受到广泛关注。平面仿生复眼无法发挥生物复眼大视场的优势;曲面仿生复眼结构更接近生物复眼,但其所成的曲面像无法被平面探测器接收。为了解决以上问题,发挥复眼光学结构的优势,得到大视场、高分辨率的小型化成像系统,本文围绕
在工作场所中,员工创造力是指其对于产品、服务、流程或商业模式所产生的新颖想法,员工创造力是整个组织创新的基石,当前技术发展日新月异的情况下,提高组织创造力是每个企业都关心的问题。提升组织创造力的关键在于人,即在于每位员工创造力的提升。因此,对员工创造力的研究十分必要。由于好奇心程度较高的员工承担风险的意愿较高,且善于处理不确定性问题,因此他们在工作中更有可能思考出创造性想法并积极付诸实践。同时,好
推荐系统根据用户行为,向用户推荐其可能感兴趣的物品。传统的推荐算法主要是基于领域的算法、隐语义模型等机器学习算法,近年来,神经网络因其强大的表示学习能力,逐渐被用于推荐领域,并取得了比传统算法更出色的效果;传统的协同过滤算法仅依赖于评分矩阵进行推荐,而忽视了丰富的边带信息,例如数据内在的结构信息和文本图像等内容信息,因而普遍面临数据稀疏和冷启动问题。基于以上两点,本文研究基于神经网络的个性化推荐系