基于预计算的BNN硬件加速器设计

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:kk345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络(Convolutional Neural Networks,CNNs)在生活中的应用变得越来越广泛。CNN模型中庞大的数据量以及计算量,也逐渐成了掣肘神经网络发展的主要因素。二值化神经网络(Binary Neural Networks,BNN)作为一种轻量型的神经网络,相比于CNN可以极大减少数据量以及计算量。基于BNN的优点,专用BNN硬件加速器的设计成为一个新的热门研究方向。但是目前在BNN硬件加速器领域的研究还存在着以下几点挑战:(1)全精度的输入图片导致额外的资源开销;(2)传统“0”值边缘填充导致数据三值化;(3)卷积层中存在大量冗余计算。针对上述几点挑战,本文基于现场可编程逻辑门阵列提出一种高性能的BNN硬件加速器,主要工作包括:(1)提出一种完全二值化处理方法本文在BNN的训练阶段,将全精度数据集内的数据按位拆分得到二值化数据集,以此数据集训练得到二值化输入的网络模型,避免全精度输入图片带来的资源浪费。在推理阶段,使用奇偶通道交叉填充(?)w(其中w为对应的权重数据)的方法,达到和传统“0”值填充相同的效果,并且解决了数据三值化问题,经过上述两种方法处理得到完全二值化的神经网络模型。(2)提出基于传递重用的行卷积查找表方法卷积层中由于高重复率的权重数据而存在大量冗余计算,本文通过行卷积查找表来跳过这些冗余计算;并且在卷积核移动过程中,对重复输入数据对应的行卷积查找表进行重用,以进一步减少计算量。除此之外,对查找表的写入过程以及读取过程进行乒乓操作,可以最大化计算资源的利用率,从而减少计算周期。实验证明,与现有工作中的优化方案相比,此查找表方案可以减少11.72%的计算量以及59.48%的计算周期。(3)设计高性能可配置的完全二值化神经网络硬件加速器本文基于奇偶通道交叉填充方法以及传递重用的行卷积查找表方法,设计一组可配置二值化计算阵列,并且通过层配置链控制每一层的计算,以提高资源利用率。除此之外,为了降低片上BRAM资源以及BRAM数据访问量,本文采用行卷积查找表与输出固定相结合的数据流。实验证明,本文所设计的加速器可以达到144.2GOPS/KLUT的资源转换效率以及3507GOPS/W的功耗转换效率。
其他文献
行为识别是计算机视觉中的核心问题,在人群分析、人机交互、虚拟现实等应用中都存在该技术的身影。而时空建模是视频行为识别的一个重要部分,有效地进行时空建模可以极大地提高行为识别的精度。本文针对视频时空建模开展研究,利用卷积神经网络设计新的网络结构以捕捉有效的时空特征,分别提出了基于协同时空建模和自适应时间迁移模块的视频行为识别算法,主要研究内容如下:(1)阐述了视频行为识别的相关背景及意义,总结了视频
现代社会对电力系统的稳定性以及供电质量的要求越来越高,高压输电线路作为电力系统中最基础的电力传输设施,保证其运行状态的安全稳定至关重要。但由于其面对的实际工作环境复杂多变,时常会发生故障,再加之我国电网覆盖面积极广,人工巡检的局限性非常明显。近年来随着机器人技术与各种智能化技术的兴起,智能化巡检机器人的应用越来越广泛,该类机器人在线路上巡检时需要获取障碍物信息来制定相应的越障策略以保证其能够在线路
重线性化矩阵是计算密钥的重要组成部分,虽然使用重线性化矩阵可以达到全同态加密的目的,但是带来的计算代价却是高昂的。在GSW同态加密算法中,密文的同态加法和同态乘法运算直接与矩阵运算相关。相较于其他基于带错学习的加密算法,GSW加密算法在做同态运算时无需计算密钥,从而无需执行重线性化矩阵运算,计算代价更小。然而,GSW加密算法在做加密运算时的数据量很大,而基于CPU加速方式的加密时间过长,因此如何缩
近年来,随着我国社会飞速发展,人们的生活节奏越来越快。饮食不规律、高负荷工作量和身体缺乏锻炼等问题导致心血管疾病对居民身体健康的影响愈加显著,心血管的发病率持续增高。心率是表示人体状态的一项重要的生理指标,医生能够通过心率对心血管患者身体进行评估,健康人群也可以通过心率检测预防心血管疾病的发生。基于心冲击描记术(Ballistocardiography,BCG)的视频心率检测方法在已经取得较为理想
神经网络已推动人工智能取得巨大的进展,诸如医疗诊断、自动驾驶等对可靠性要求较高的领域也正在加速引入神经网络。传统计算系统已经无法满足神经网络的规模和算力需求的日益增长,使用特定硬件加速神经网络已是时下通行的做法。基于FPGA的神经网络加速系统由于其在能效比、灵活部署等方面的优势,已被大量使用在包括嵌入式终端等在内的端到端的工业和军用场景。在这些特定的工作场景中,极端的工作环境时有出现,如车机系统中
MEMS光学加速度传感器是一种将惯性系统内部敏感质量块的位移变化,转化为光学系统中光信号的变化量(波长、频率、能量)来间接测量加速度的传感器件,具有精度高、抗电磁干扰性强等优良特点,广泛应用于飞机导航、人造卫星的姿态调整、国家基本重力网测量绘制以及石油地震勘探等领域。同时在军事领域,采用精度更高的加速度测量器件将给武器装备的性能带来极大的提升,具有极其重要的战略意义。本文设计了一种基于Fabry-
三维测量是机器视觉研究的前沿性问题,三维测量系统是机器视觉系统的重要组成部分。为了实现实时三维形貌测量和提高测量精度,研究人员提出了众多的方法。基于结构光的三维重构可以实现非接触测量,与此同时面结构光相比线结构光具有重构速度快和较高精度等优点。系统在处理一幅普通的灰度图像需要几十万甚至上百万个像素点的遍历,重建一个场景往往需要多幅这样的灰度图像,这样就大大增加了重建一幅场景所需的时间。其次,由于投
火灾是严重威胁公共安全和经济社会发展的主要灾害之一,为了有效预防和减少火灾事件所造成的损失,火灾探测技术应运而生。点型感烟火灾探测器是目前广泛应用的一种火灾探测器,其性能直接地影响到火灾预警的实时性和可靠程度,所以对点型感烟探测器的性能评估尤其重要。国家标准GB4715-2005规范了点型感烟火灾探测器的标定环境的要求,为进行同类火灾探测器的性能检定提供了依据。本文研究了点型感烟火灾探测器标定实验
目前,工业生产的需求日益增加,大量含镉废弃物以烟、渣和废水的形式向环境中排放,使其逐渐变成了影响人类健康的“公害”之一。镉是一种剧毒重金属污染物,其生物蓄积性强、半衰期长,过量镉接触会对人类的肾脏、心血管、肺、免疫系统等造成不可逆转的危害。因此,超痕量镉离子的灵敏且特异检测在食品安全和环境监测中均具有重要意义。为了解决现有重金属镉离子(Cd2+)检测技术存在的检测精度低、选择性差以及无法满足快速实
对于目前高温下的视觉测量,如何降低高温部件本身发出的辐射光以及高温气流扰动对图像质量的影响仍然是一个挑战,这在航空航天或汽车制造等领域具有重大影响。单像素成像(Single-Pixel Imaging,SPI)作为一种新的成像方法,近年来得到了较好的发展。SPI具有成本低、信噪比高、成像谱宽等优点,特别是在弱光及非可见光条件下,它具有显著的优势。本文针对高温下复杂的光学成像环境,提出了一种结合单像