基于FPGA的图像分类CNN网络加速的研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:w313829237
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络在图像分类上的高准确率使其被广泛应用在自动驾驶、人机交互,移动机器人等重要领域。然而,巨大的模型参数量和极高的算力需求成为制约卷积神经网络在移动端应用场景部署的主要瓶颈。因此近年来,多项研究致力于设计轻量级网络和高性能硬件加速器。以Mobile Nets为代表的深度可分离网络大大减少了参数量和运算量,受到研究人员青睐,并被部署在基于GPU、FPGA、ASIC等加速器上。在上述加速器中,FPGA凭借高度可重构性成为备受关注的研究平台。以往基于FPGA的卷积神经网络加速器大多只关注性能与实现,面对庞大的片内存储需求和片外存储访问量,过度依赖先进平台的资源和带宽优势,难以向下兼容。本文的主要贡献是设计了一个可伸缩的轻量化FPGA卷积神经网络加速器框架。首先,本文从加速器关键技术入手,对计算引擎、数据流、控制体系和数据量化等基本方案进行了分析与确定,随后设计了兼容多种运算的多尺寸卷积计算引擎。针对深度可分离网络难以直接使用层融合优化手段的问题,本文提出了一种多向融合卷积计算顺序设计方法。基于该方法,所提出加速器框架在不缓存输出特征数据的前提下实现部分卷积层融合,大大减少了片内存储需求和片外存储器访问量。除此之外,本文还对加速器的控制体系和片外存储器地址空间进行了优化设计,使加速器框架更加灵活,片外存储器更加高效。最后,本文对加速器框架进行了完整的仿真,从模块到整体验证加速器功能符合预期,并通过在不同资源和带宽规模的FPGA平台上部署多种规模的加速器的板级测试手段,对加速器框架进行性能评估。评估结果显示,即使在性能与资源均较落后的FPGA平台上,加速器的吞吐率仍优于CPU。在性能较好的FPGA平台上的测试结果优于最近几年加速器研究工作,且在功耗表现上比GPU优秀4倍以上。证实本文提出的加速器框架既能达到较高的计算性能又具有出色的可伸缩性。
其他文献
静立平衡能力等级判断是治疗功能性平衡障碍患者的首要任务,为制定合理的康复治疗提供了基本依据。本文从内源性角度展开了对人体静立平衡能力评估的定量分析研究。对于现有医学康复领域平衡判断方法进行了讨论,认为现有方法完全关注于人体平衡的外在表现,评价结果中不可避免的带有一定的主观性和片面性因素,因此导致当前人体平衡评估误诊率高、临床适用患者面窄等情况。本文从中枢神经系统入手,探究了大脑对于静立平衡的响应机
随着人民生产生活水平的不断提高,空气调节设备的使用越来越广泛,它在带来舒适环境的同时,其能源消耗在建筑能耗的比重越来越大,已占40%~50%。其运行节能问题日益受到重视,各种节能方法和技术也正被深入研究和推广应用。本文旨在研究部分负荷条件下,基于节能为目标的冷水机组并联运行的操作优化算法,主要研究内容如下:(1)能耗模型及优化算法选择。论文首先阐述优化问题的求解目标及求解步骤,并对冷水机组工作原理
水下成像技术在许多领域有着重要的应用,例如水下资源勘探,水下工程建设,水下考古等。然而由于光线在水下传播时会被吸收和散射,导致获取的水下光学图像出现蓝绿色色偏和低对比度等问题。这不仅影响了图像质量,增大了人眼获取和理解图像内容的难度,还影响了计算机视觉系统检测识别的性能。因此,如何有效地矫正水下图像的色偏,提升对比度,以及提升水下图像目标检测识别任务的精度具有重要的研究价值。论文具体研究内容如下:
混合式教学将成为未来高校教学的常态,要从范式变革的层面来深入理解混合式教学,充分融合线上线下的教学。混合式教学要重视教学设计。通过自编的质量评估工具对X大学的32份线上线下混合式教学设计方案进行评估,运用Rasch模型分析数据,找到当前混合式教学在目标设计、评价设计、内容设计、方法设计和资源设计五个方面中存在的难点,并在此基础上,提出混合式教学设计应有逆向思维,贯穿全过程和为学习搭建支架。
时滞特性广泛存在于工业对象中,由于时滞的存在,控制器无法根据被控对象最新状态输出控制量,容易造成超调量增大,调节时间延长甚至震荡发散等问题,提高了控制难度。预测PI算法是一种解决大时滞问题的先进控制思想,该算法具有结构简单,设计直观,整定参数少且调节容易等优点。但其也存在一些缺陷,如控制大惯性滞后对象时抗干扰能力弱,对于非自衡对象的控制效果不理想等问题。本文采用预测PI算法作为基础,针对上述问题展
快递业作为新兴服务业,在刺激消费、发展经济和推动产业转型升级方面体现了重要的作用,是支撑我国国民经济发展的重要产业之一。进入21世纪,电子商务的蓬勃发展带动了快递业的起步,也促使快递需求变动幅度的加大和预测难度的提升。但如何分析电子商务环境对快递需求所产生的影响?如何建设新型指标体系以对快递需求的预测发挥作用?如何将快递业的季节性特征更好地运用到需求预测中?本文旨在对以上问题做出解答并预测快递需求
机载无源传感器具有隐蔽性好、机动性强、覆盖范围广等优点,已广泛应用于目标定位、跟踪、监视等领域。为了实现资源的高效利用,提高目标的跟踪效果,需要对机载无源传感器资源进行有效调度,动态实现无源传感器与跟踪目标的资源最佳分配,以及机载平台的最佳观测机动。目前传感器调度策略主要以最大化即时跟踪效益为决策准则而未考虑调度策略对未来的影响,具有一定的短视性。对此,本文针对机载无源传感器协同跟踪下传感器调度问
轮廓作为图像的初级视觉要素,对提高后续视觉感知任务的快速性及准确性起着关键作用。传统轮廓检测方法多以计算机数学模型实现,而视觉系统的复杂精妙性及其信息感知机制的智能高效性是现代计算机视觉系统难以相媲美的。受此启发,本文将探究视觉系统信息感知的内在机理,以此为基础构建仿生计算模型并进行轮廓检测应用。一方面将从宏观角度对视通路生理结构和信息流传递路径进行建模探究;另一方面将从微观角度对神经信息编码、感
所谓丰满的任务就是一种以学术实验、调查研究等成果为任务形式的总结性评价,它在保持一般的真实性评价的基础上,能够借助跨学科的设计来进一步培养学生的高阶思维能力。了解实验室中生物技术的具体操作,撰写研究报告,辩论多种技术的道德争议,邀请学术界的专家参与国际会议……这样一个从技术领域横跨到道德领域的综合性任务,已然是昆士兰州基础教育阶段中用以评价学生的一部分,它被人们称为"丰满的任务(rich task
期刊
运动小目标的检测跟踪技术在军事、民用领域具有广泛的应用。实际应用中背景一般较为复杂,传统的运动目标检测跟踪方法存在如下问题:复杂背景中运动小目标的检测难度较高、算法难以在不同场景中兼顾处理速度及精度。针对上述问题,结合检测前跟踪方法及图像处理相关技术,提出了基于子空间投影的快速单目标检测前跟踪算法;在此基础上,针对多目标跟踪场景,提出了基于子空间投影的快速多目标检测前跟踪算法。本文的主要研究内容如