基于FPGA集群异构平台的卷积神经网络优化研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：gogouu

【摘要】

：

【作者】

：

梁浩天

【出处】

：

西安电子科技大学

【发表日期】

：

2021年05期

【关键词】

：

板间异构 FPGA集群流水线结构卷积神经网络吞吐率优化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着物联网、自动驾驶、智能安防等人工智能应用新兴领域的快速发展,与此对应的数据体量和计算量增长对处理器计算性能的要求不断增高。类似卷积神经网络这种面向数据计算密集型任务,对单块计算设备的硬件资源要求极高。为此,本文采用多板异构的方式,提出了一种让FPGA集群作为神经网络的加速设备。一方面多块FPGA可以灵活提高可使用的硬件资源,一方面具有较好的能效比。本文重点从FPGA集群异构平台设计,面向卷积神经网络FPGA集群异构平台的实现和面向卷积神经网络的FPGA集群异构平台优化三个关键问题入手,完成基于FPGA集群异构平台的卷积神经网络优化设计。论文的主要工作如下:1.面向卷积神经网络的硬件加速需求,提出了一种基于FPGA集群异构平台的模块级流水线结构。该方法将FPGA集群作为神经网络的推断加速器,可以根据不同的神经网络规模灵活地调整算力,并同时兼具高能效比的特点。将对外连接主节点FPGA上的ARM核作为异构平台的控制端,负责板内数据传输和与上位机通讯。将FPGA集群作为异构结构的协处理器端,主要负责卷积神经网络的执行。在FPGA集群处理过程,采取一种模块级流水线的优化策略,将卷积神经网络按运行时间拆分为子模块,由不同节点分别执行。从单次处理流程看,任务是由不同模块按顺序执行。在大规模任务处理情况下,模块间采取流水线思想,各模块可以并行处理。并在后续基于Le Net-5和Alex Net网络实现验证。2.完成了FPGA集群异构平台的设计实现与验证分析。结果表明:对于Le Net-5网络,相比于单块FPGA执行方式,使用FPGA集群异构方法在处理时间缩短到单板开发所需时间的38.94%。本文设计的最大吞吐率提高到单板开发方式的2.57倍,查找表(LUT)的资源转换效率提高到单板开发的2.61倍,能效比方面提高到单板开发的2.82倍。对于Alex Net网络,相比于单块FPGA执行方式,使用FPGA集群异构方法在处理时间缩短到单板开发所需时间的17.74%。本文设计最大吞吐率提高到单板开发方式的5.64倍,DSP的资源转换效率提高到单板开发的3.11倍,查找表(LUT)的资源转换效率提高到单板开发的2.39倍,能效比方面提高到单板开发的1.05倍,满足设计要求。3.完成了吞吐率和能效比的优化设计。基于协处理器中模块级流水线的处理方式,在定量分析板间的数据传输延时的基础上,提出了将板间通信延时作为流水线一级的优化设计方案。同时,本文提出资源转换效率(RCE)的评价方式,定量地衡量单位资源对于吞吐率的贡献程度。结果表明:对于实现Alex Net的FPGA集群异构平台,使用该优化设计将吞吐率提升到了该方案已有程度的105.19%,满足设计要求。4.针对卷积神经网络模块划分的优化,提出了一种基于二分法的任务匹配优化设计。该设计将卷积神经网络的不同层为不可拆分的最小单元,并通过屋顶线模型分析不同情况时的吞吐率瓶颈,并借鉴二分法思想迭代计算得出最优划分结果,并建立了总时间离散程度(TTD)的定量评估方法。结果表明:对于实现Le Net的FPGA集群异构平台,使用该优化设计将吞吐率提升到了该方案已有程度的109.68%;对于实现Alex Net的FPGA集群异构平台,使用该优化设计将吞吐率提升到了该方案已有程度的106.07%,满足设计要求。

其他文献

融合信任度的高校图书馆个性化推荐研究

随着大数据时代的到来,图书馆中的资源越来越丰富。面对海量的图书资源,用户需要花费大量的时间和精力来获取所需的图书资源,而传统的搜索查询已无法满足用户的需求。用户对资源的需求越来越细致化、精准化,用户越来越难以快速、准确地获取其需求的资源。图书馆以用户服务为核心,用户的需求是个性化推荐的基础。为了满足用户的需求,以及做好图书馆工作,个性化推荐系统应运而生。经过专家学者的研究,个性化推荐已经非常成熟。

学位

高校图书馆个性化推荐协同过滤信任度

我国城市综合管理执法人员的形象重塑研究

根据2014年5月26日中国社会科学院发布的蓝皮书《形象危机应对研究报告2013—2014》报告称,城管人员是被我国民众认为我国形象最差的公务人员之一,群众差评率已超过我国其他

学位

城市综合管理人员行政执法形象重塑

基于无监督深度学习的医学图像配准关键技术研究

学位

基于对抗攻击原理的DGA域名生成与检测技术研究

随着人们在日常生活中对互联网的需求度日益提高,网络安全问题越发受到重视。在近年发生的大型网络攻击中,黑客都采用僵尸网络对普通计算机造成了重大安全威胁。僵尸网络指攻击者出于恶意目的,通过命令控制信道操控一群受害主机所形成的攻击平台。黑客能够通过该平台实施多种类型的网络攻击,而域名生成算法(DGA)作为帮助攻击者实现远控、逃避检测的重要一环,是僵尸网络赖以生存的关键技术。大量DGA域名的存在给负责打击

学位

僵尸网络DGA域名检测对抗样本GAN模型LSTM算法

渤海大学汉语中级阶段布隆迪留学生汉语语序偏误分析

此次调查研究依托于渤海大学布隆迪留学生中级汉语写作课程,通过跟踪、收集布隆迪留学生三个学期写作课日常作业,并从中选取七十一篇作文作为此次研究的语料,统计、分析了布隆迪留学生在汉语写作中出现的语序偏误,并针对这些语序偏误提出了教学建议,并在实际课堂教学中做出了实践,给出教学反馈。论文中统计了渤海大学布隆迪留学生在写作中频繁出现的语序偏误的概况,并对其在写作中出现的语序偏误类型进行了分析。从母语负迁移

学位

布隆迪留学生汉语中级阶段语序偏误

并行与分布式神经网络训练中数据通路的优化

学位

全球价值链嵌入影响我国资源型产业技术升级的实证研究

世界各国在国际分工格局出现的同时,纷纷参与到全球价值链中。对我国资源型产业来说,嵌入全球价值链是一把双刃剑。一方面,全球价值链嵌入便于获取先进技术,有利于促进技术升级。同时价值链上的权力关系限制知识流动,对技术升级具有锁定效应。由于我国资源型产业以国有企业为主,经营方式上具有垄断式和投机式特点,外部监管不到位,在参与全球价值链动态竞争过程中,忽视提升自身市场竞争力的机遇,容易放弃“费力不讨好”的有

学位

技术升级资源型产业价值链嵌入

内容教学法在高中英语阅读教学中的应用研究

高中英语课程总目标强调从学生的学习兴趣、生活经验和认知水平出发,让学生在体验、实践、参与和交流中发展综合语言运用能力,这与内容教学法的教学理念是一致的。高中英语阅

学位

内容教学法输入假设有意义接受学习阅读教学高中英语

威尔第的“席勒歌剧”研究

学位

桥式起重机吊装避障路径规划方法研究

桥式起重机广泛应用在钢铁化工、港口码头、物流周转、工矿企业等场所,桥式起重机横驾在工作场景的上方,不因地面的物体阻碍,是一种非常常用的起重设备。由于人工驾驶存在失误及工作场景的限制,伴随着电子通信技术的飞速发展,起重机未来会向着无人化、智能化发展,那么路径规划将是起重机智能化的关键部分。本文将国内外学者对桥式起重机路径规划的研究进行了分析总结,并简述了路径规划的方法,之后针对路径规划中对于三维环境

学位

桥式起重机吊装避障路径规划粒子群算法动态环境RRT算法

基于FPGA集群异构平台的卷积神经网络优化研究

其他学术论文