轻量化卷积神经网络加速器研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:alwbgs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相较传统的图像处理方法,深度神经网络的效率和准确率都得到了显著的提升,在很多应用中都可以发挥明显的作用。然而,卷积神经网络计算非常密集,CPU等通用处理器难以对卷积计算进行并行加速,效率十分低下,在应用中会产生延迟。而高端的GPU在计算卷积神经网络时虽然效率尚可,但它的高功耗限制了它在移动端平台的应用。比如自动驾驶和机器人这样的移动端平台,对低延迟和低功耗都有很高的要求,CPU和GPU在实现这些应用时都不是最佳选择。而FPGA内部集成了大量DSP资源,由于无需指令,它可以充分发挥浮点计算能力,使得在加速数据密集型计算时拥有巨大优势,且与高端的GPU相比时,FPGA的功耗相对低很多。但是,VGG等大型卷积神经网络由于巨大的参数量和计算量,很难在资源受限的FPGA上实现。而轻量型网络MobileNetV2采用深度可分离卷积代替普通卷积,显著降低计算量和参数量,大大降低了对资源的需求,让我们看到了复杂的卷积神经网络在移动端平台上实现的可能性。所以,研究MobileNetV2这种轻量化卷积神经网络模型的计算加速对于复杂的卷积神经网络在移动端的实现具有十分重大的意义。在上述背景下,论文设计并实现了一种轻量化卷积神经网络加速器,通过针对深度可分离卷积改进结构、流水式设计和提高网络并行性等方法提高加速器的计算速度。论文的主要工作包括:使用cifar-10数据集在keras框架上完成了对MobileNetV2网络的权重训练,保存训练时准确率最高的权重用于加速器的前传网络实现。详细分析了各种并行方式的数据搬运方式和所需的存储、带宽,选用特征图卷积窗口内部9个数的并行和8个特征图并行的方式进行并行计算。结合使用的FPGA的资源和特性,完成了卷积模块的设计,针对深度可分离卷积进行了数据搬运上的优化,测试得出,实现深度可分离结构相对于普通卷积结构大约可以提升6.05倍速度。设计了一种高性能的卷积神经网络加速器结构,其中加入了一体化卷积运算单元阵列和交替缓冲器,并使用了数据压缩的方法,这种结构可以批量地进行卷积运算,减少参数加载引起的延时,并很好地节省了存储,显著提升了效率。基于Altera开发平台实现了对MobileNetV2前传网络的加速并对资源使用情况及设计性能进行了分析。MobileNetV2在DE1-SoC上实现了96.61%的图片分类准确率,运算单张图片耗时5.2ms。相比Cortex-A9的98.52%的准确率和每张图18.3ms的分类速度,该加速器在只损失了1.91%的准确率的情况下,提升了约3.52倍的速度。
其他文献
精神分裂症是一种多基因病,其病因和发病机理还不十分清楚,多数学者认为遗传因素在发病上有重要作用.据国内外报道,精神分裂症的遗传率在70%~80%左右.当然,遗传作用是形成精神
小学生作文必须依靠比较完善的内部语言,经过材料选择、主题确定、遣词造句、谋篇布局等一系列的复杂过程,方能形成。对学生作文来说,“练笔”是一种很好的语言积累和素材积累。
报纸
提要 本文根据硬质脆性岩石中已开隧道中的岩爆实例,系统论述了岩爆断面、弹射岩块的几何形态特征,岩爆的一般力学和动力学特征以及声学特征,时空效应等。提出了岩爆洞室横断面
本文详细介绍了全自动汽车转向角测量系统用旋转电位器对汽车转向角进行在线测量.该系统采用了机、电、光、气等多项技术,在测量过程中能实现自动跟踪、准确定位和快速检测,
在默多克的思想中,人们通常把自我认知想象得太浪漫,认知自己和认知别的东西一样困难。而在现实中缺乏自我认知的人,也会因此束缚住手脚。小说《钟》通过宗教团体分裂的过程
目的:探讨儿童微小病变型肾病综合征合并小管间质损伤的临床与病理特点。方法:回顾性分析2013年1月至2017年11月在重庆医科大学附属儿童医院肾内科住院并有完整肾活检资料的148例PNS患儿的临床与病理资料,依据其是否发生小管间质损伤而分为TIL组与NonTIL组,比较两组间的临床表现及实验室资料的特点;分析124例MCN患儿的随访资料,分析TIL对MCN患儿转归情况的影响。结果:(1)148例M
可达性反映人们到达目的地过程所克服的空间阻力大小,能够评价充电站的服务能力。采用地理信息系统可达性分析技术中的网络分析法与两步移动搜寻法,以北京市延庆、怀柔两个区
<正> 异步电动机转子上的各点在定子磁场中受到不等的磁性吸力,致使转子受到一个径向拉力,这种现象称之为单边磁拉力。产生单边磁拉力的原因较多,但主要是电机中的磁路和电路
通过分析多目标的、有时间窗的车辆路径问题,对各个目标进行多属性不确定性语言评判,结合相关专家的综合意见以及决策者自身对专家意见的偏好,将决策者对目标属性的离散意见