基于FPGA的卷积人工神经网络加速方法与实现研究

来源 :兰州大学 | 被引量 : 8次 | 上传用户:liuligen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,与传统的机器学习相比,具有更多隐含层的深度卷积神经网络具有更复杂的网络结构和更强的特征学习以及特征表达能力。自从引入使用深度学习算法训练的卷积神经网络模型以来,它在计算机视觉领域的许多大规模识别任务中取得了显著的成果。就目前卷积神经网络应用技术的发展而言,算法本身需要对图片等数据进行卷积运算等操作,致使使用CPU会带来运算速度极慢,极高的功耗的也是限制卷积神经网络发展的一大重要因素。此外,在小型、低功耗硬件设备中,嵌入式处理器在运算架构与通用处理器类似,以串行的方式进行运算,故无法实现卷积神经网络中大量、独立的乘加操作。对于DSP来说,虽然其对于乘加运算进行优化,但是依然难以胜任大规模的图像卷积运算。在这种情况下,由于现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)具有快速的开发周期和低廉的成本,可以发挥出其在尺寸、功耗以及并行运算方面的优势。因此,设计一种不依赖于具体应用环境的专用FPGA来提高卷积神经网络的计算速度,将产生巨大的经济价值和社会价值。在基于冯·诺伊曼体系结构的传统计算机中,CPU适用于具有复杂过程但低并发性的场景,难以有效地应对具有极高并发性和简单的单步操作的卷积神经网络计算。经调研得知,卷积神经网络的卷积、池化和全联接三种操作,由并发加乘运算组成的卷积操作的CPU占用率达到70%左右。基于此考虑,本课题开发了一种基于FPGA的卷积神经网络加速硬件模块,以大并发的方式实现卷积计算,进而提升卷积计算的速度。详细介绍了乘法器的实现过程,以及由这乘法器与加法器计算资源构成的矩阵乘法计算模块,还介绍了数据通讯和存储管理等相关模块,所有模块协同工作完成卷积计算。此项研究为完整的卷积神经网络的硬件实现提供了依据和基础,具有较为重要的科研意义和工程价值。
其他文献
2017年9号“纳沙”和10号“海棠”双台风袭击福建海域,7月31日晚,貨轮“兴航868”轮在湄洲岛东南面水域进水,现场风力7~8级,阵风9级,船上7人弃船,请求救援。接福建水上搜救中心信息,东海救助局指派“东海救111”轮前往现场。“东海救111”轮火速赶往现场,克服夜间能见度不良、风大浪高等困难,顺利安全的将7名人员从漂流的救生筏上全部救下,移交当地相关部门。  (东海救助局供稿)
上海港黄浦江航道狭窄弯曲,避让空间小,是水上交通事故相对多发水域。冬季寒潮大风的来临使得此间操纵船舶的难度大幅增加,严重威胁港口设施及船舶安全。本文通过简单介绍风
为了摸清乔木林在河南省森林碳储量中的地位,基于河南省第六次(2003年)和第七次(2008年)森林资源清查数据,对河南省乔木林的碳储量及其碳汇经济价值进行了估算.结果表明,河南省乔
我国高校新闻传播教育事业的发琵,是从1983年5月中宣部与教育部在北京召开首届全国新闻教育工作座谈会阳1984年10月中国新闻教育学会正式成立以来逐步开始的。二十多年间,改革
本文通过分析岛礁区的特点以及专业救助船舶在岛礁区作业的若干风险,结合笔者所在单位实际相关救助情况分析,总结了专业救助船舶在岛礁区救助遇险人员的施救方法和风险防控措