面向通用DSP的卷积神经网络加速器

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:gdat86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能应用的发展,基于卷积神经网络(Convolution Neural Network,CNN)的深度学习算法成为机器视觉处理领域的核心算法。但是面对互联网数据的爆炸式增长,深度学习网络变得日益复杂,计算量持续大幅度增长等问题,传统的通用处理器已经不能满足性能需求,研究其硬件加速器对设计智能芯片具有重要意义。DSP面向数字信号处理应用,具有功耗低、性价比高、可编程性好等特点,基于通用DSP架构集成专用的CNN加速器可以发挥通用DSP的性能,既可以利用DSP的原有编程开发环境,又可以快速提高DSP对深度学习算法应用的加速性能,快速扩展了DSP的智能运算范围。本文面向图像处理、视频智能处理加速需求,基于某数字信号处理器X-DSP的体系结构,设计实现了一种CNN加速器。论文的主要工作如下:首先,在分析卷积神经网络的算法和X-DSP的体系结构与性能的基础上,设计了CNN加速器整体设计结构;根据其外部存储带宽确定CNN加速器运算单元性能和片上缓存大小。通过对卷积层算法的并行性分析展开了理论分析和片上缓存设计。其次对池化层中常见的最大池化和平均池化展开了讨论,提出了对运算单元功能的扩展,最后实现了ReLU激活函数,对卷积层完成的所有输出特征值进行激活。其次,为了节省存储部件带宽,提出了软件压缩数据、硬件解压数据的方案。提出了一种基于描述符的控制信号,用户可以通过DSP将提供的库函数准备好,运算过程中不需要干预运算。加速器与DSP连接时采用了AXI总线协议,实现了加速器面向DSP的接口设计。最后,采用Verilog HDL实现了CNN加速器的RTL级代码,并完成了模块级功能验证和性能评估,实验结果表明,所设计的CNN加速器功能正确。同时基于某厂家40nm标准单元库下按照1GHz的目标频率对设计进行逻辑综合,时序满足要求。
其他文献
自21世纪以来,能源与环境问题已成为关系到全人类福祉的重要议题,各国政府为了建立本国的清洁可再生能源体系,对于环境友好型和几乎零排放的新能源储能锂电池的研发与推广应
目前,多智能体系统因其广泛的应用前景吸引了多个领域学者们的关注。一致性控制问题作为多智能体系统的核心,更是研究的重点。随着通信技术发展的突飞猛进,传统的一致性问题
认知无线电技术允许认知用户主动探测发现和合理利用空闲频谱资源,缓解了频谱资源日益紧张的问题。本文主要研究了两种协作认知无线电网络(CCRN)中的频谱租借策略,在这两种策
煤矿开采不可避免地排放矿井水,同时部分煤矿位于缺水地区。研究矿井水的处理与利用,有利于缓解煤矿缺水现状,提高绿色矿山建设和清洁生产水平,促进矿区生态文明发展。本文在总结分析国内外相关科技文献的基础上,深入分析巨野矿区某煤矿矿井水水化学特征,开展了高矿化度水处理技术、中低温矿井水余热综合利用技术研究与实践,拓展了矿井水综合利用途径,提高了绿色矿山建设和清洁生产水平。该研究可望为改进矿井水综合利用和清
斜桩基础作为风力发电工程、输电塔工程、海上钻井平台及潮汐发电工程中常用的基础形式,在承受竖向荷载与水平荷载时具有良好的承载性能,能够满足承载力与变形的要求。但针对
进给系统是数控机床不可缺少的一部分,滚珠丝杠副又是精密机床及数控加工中心的关键部件,丝杠的热变形会严重影响精密机床的加工生产精度。本文主要研究提高数控机床进给系统
在图像传播盛行的背景之下,视觉文化高度发展,无论是传播者的传播方式还是受众的接收方式都迎来了时代性的更迭。在体育领域也是一样,为了迎合受众,对于体育图像的优质化应用
随着高速、高精密机械产业的发展,高精密球体的加工成为目前超精密加工领域的研究热点。加工压力对球体加工精度影响显著,直接决定了抛光过程中工件的最终质量和抛光效率。传
近年来,我国日益重视可再生能源的应用,但可再生能源在实际应用中,面临着诸多挑战,其中如何存储好就是一项亟待解决的问题,因此,钒电池技术应运而生。钒电池,作为一种液流电
群集蜘蛛优化算法(Social Spider Optimization,SSO)是一种模拟群集蜘蛛个体之间相互协作捕食、公共网交换信息以及雌雄个体之间繁衍后代等一系列行为而设计的启发式优化算法