基于卷积神经网络加速引擎的小目标检测算法实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:papaya007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前目标检测领域已有诸多研究,算法也层出不穷,如:R-CNN(RegionCNN)、YOLO(You Only Look Once)、SSD(Single Shot Multi Box Detector)等,但这些算法的小目标检测效果却难以尽如人意。同时,卷积神经网络的计算密度大,所以对于实时目标检测,研究如何利用硬件加速运算显得尤为重要。本文将算法移植到目标板上,使用目标板上硬件单元加速计算,并针对算法移植精度下降问题提出优化方案。在此基础上通过海思媒体处理平台(Media Process Platform,MPP)和媒体处理芯片智能视觉异构加速平台(Smart Vision Platform,SVP)设计了基于加速引擎的小目标检测系统。本文主要研究内容如下:(1)首先研究了目标检测算法,针对小目标检测性能不佳的问题,对YOLO V3进行了精度与速度的改进;然后进行算法移植实现,将算法模型移植到海思开发板上,利用海思SVP平台的NNIE(Neural Network Inference Engine)硬件模块对卷积神经网络部分进行加速;最后针对算法移植过程出现精度下降的问题,本文提出优化方案:合理设置转化参数以及置信度阈值、采用等比例的形式进行图像缩放。(2)本文基于海思SVP平台与MPP平台开发了一个小目标检测系统。该系统在目标检测的不同阶段调用开发板上不同硬件进行处理,实现目标的快速检测。实验结果表明,算法移植造成的置信度下降在4%以内,精准率下降约2%,YOLO V3算法经过改进后可将实际每秒处理帧数提高到17帧。
其他文献
物联网数据异常检测是物联网、大数据和机器学习等技术融通结合的应用场景之一。异常检测对提升物联网系统的安全性、稳定性以及所采集数据的准确性有重要意义。然而,传统物联网云平台不支持机器学习模型的部署,这给物联网大数据的开发利用带来了桎梏。目前主流的解决方法是在Iaa S云主机上部署算法模型来实现异常检测端,但是这种方式存在“闲时计费”问题,成本高昂,且伸缩性和通用性较差。因此,如何在现有异常检测算法的
近年来,随着互联网和信息技术的发展,电商行业进入门槛也随着降低,B2C电商之间的竞争愈加激烈。从市场格局来看,除了阿里和京东雄踞市场之外,“独角兽”企业——拼多多也在网络零售界刮起一阵拼购狂潮。这使得原来的一些主流电商的处境变得十分艰难,线上获客成本持续攀升。加之,电商企业在运营过程中,普遍存在着高昂的成本支出。若是对成本缺乏有效规划与控制,将会在激烈的市场角逐中处于劣势,甚至随时会被市场的优胜劣
文言文是中华民族伟大智慧和思想传承的载体,然而现代人阅读文言文仍存在较大的障碍,人工翻译文言文的成本过高,大量文言文古籍缺乏数字化的现代汉语翻译。随着互联网与人工智能的飞速发展,机器翻译相关研究层出不穷,利用机器翻译模型进行文言文古籍的批量翻译对文言文译文数字化具有重要意义。然而目前缺乏针对文言文机器翻译任务的研究,同时缺乏高质量、大规模的平行语料数据集,文言文机器翻译研究发展缓慢。此外,文言文翻
当下社会的繁荣发展,离不开密码学的保驾护航。基于S盒的密码算法是最经典的分组密码算法之一,ARX型结构因其软件友好实现性被业界广泛应用,同时差分分析是对现代密码算法最经典的分析方法,因此研究基于S盒的密码算法和ARX型密码算法抵抗差分分析的安全性具有重要意义。本文重点研究了基于S盒的密码算法和ARX型密码算法的建模问题,利用MILP技术对Craft算法、SM4算法和Ballet算法进行差分分析。针
随着远程直接内存访问(Remote Direct Memory Access,RDMA)技术的不断发展,越来越多的数据中心选择采用这种低延迟高吞吐的方式进行通信。RDMA通过将原本在CPU上完成的一部分计算转移到网卡上,从而解放CPU算力,能够做到在远端CPU不被唤醒的情况下访问远端内存上的数据。除了RDMA,非易失性主存(Non-Volatile Main Memory,NVMM)在近年来也被数
随着集成电路在微波和太赫兹领域大力发展,异质结双极晶体管(HBT)以高增益、高频率、高可靠性等优势引起研究人员广泛关注。HBT器件作为高频电子器件之一,拥有广阔的应用前景。然而,器件模型仍需要完善,模型参数作为器件模型中重要的部分之一,精确参数的提取具有重要意义。本文对HBT器件的模型参数提取以及软件设计展开。通过对HBT器件大信号等效电路模型原理和参数提取方法分析,提出了一种以直接参数提取为基础
本文研究了通信系统中满足用户服务质量需求时的最小化功率分配策略优化问题。在高可靠低时延通信场景下,假设接收端与发送端不知道信道状态信息时,对端到端的单天线瑞利块衰落信道模型进行研究。本文采用有限块长编码率(Finite Block Length,FBL)保证时延约束;采用具有一轮重传的增量冗余混合自动重传机制(Hybrid Automatic Repeat request with Increme
近年来,远程直接内存访问(Remote Direct Memory Access,RDMA)和非易失性内存(Non-Volatile Main Memory,NVMM)被大量应用于分布式系统中。随着RDMA和NVMM支持的存储与访问性能不断增长,传统的锁管理机制开始暴露出开销高的问题。结合RDMA原子取和加(Fetch and Add,FA)原语和面包店算法的锁机制可以在保证数据一致性的同时,降低
随着信息物理系统的不断发展,服务数量日益增长,有许多服务都提供了相同的功能,如何在这些服务中为用户选择出合适的服务成为了当前热点研究的问题之一。本文基于用户与服务的时空信息提出了基于域感知因式分解机(FFM)的推荐模型(LBFFM)以及基于长短期记忆网络(LSTM)的混合推荐模型(LSTM-HPLT)以满足信息物理系统中用户调用服务的不同场景。首先,本文针对用户调用服务时产生的冷启动问题,构建了基
随着互联网5G时代的到来,军工通讯行业也变得越发成熟,竞争也比往年更加激烈,企业依靠自身内在增长的步调放缓。市场竞争环境之激烈,使得企业间加快了整合步伐,存在部分企业选择采取并购方式来获得迅速发展。企业取得协同效应是判断企业并购成功的依据之一,但真正并购成功的案例只是少数,并购失败的案例相对较多。因此,关注和研究军工通讯企业的横向并购活动就变为一个很迫切的问题。本文首先回顾了整个并购交易的背景、动