面向图像识别的卷积神经网络加速器研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:D243435dsfsdfqwe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络算法在计算机视觉领域取得越来越突出的成就。信息时代数据的爆炸让算法“学”得越来越多,集成电路的发展提供的强大计算能力让算法“学”得越来越快。但是,算法在取得越来越好的效果的同时,复杂度也越来越高。另一方面,智能手机、机器人、智能驾驶等技术开始广泛应用,而在这些应用场合下,由于隐私、实时性强等要求,大部分应用只能进行本地运算,传统的通用处理器架构并不适合算法的实时运算,所以有必要对算法的加速进行探索研究。本文具体工作和创新如下:1、本文训练了基于卷积神经网络的人脸识别算法,并基于该算法搭建了人脸检测系统,该系统试验结果表明本文训练的人脸识别算法具有一定实用性;另外,本文也训练了基于卷积神经网络的数字识别算法;两个算法都达到了较高的识别准确率。2、本文针对卷积神经网络算法难以在传统处理器进行实时计算这一问题,采用了一些设计方法,提出一种卷积神经网络加速器架构。该架构针对算法密集的乘累加计算设计专用的乘累加计算单元;根据数据可重用性,设计不同的缓存级数用于对数据进行重用,减少额外的访存;依据卷积神经网络算法的并行性将计算单元设计成可并行模式,并将计算架构设计成并行可配置形式,用于支持算法的不同并行计算方式;根据卷积神经网络算法计算中有很多“0”参与运算,将乘法器设计成可避免“0”参与计算的模式;另外本文在设计计算结构时,将二维卷积化解为一维卷积减少了乘法器的使用,使本文提出的架构,相比于同类型加速器架构,在性能上有较大优势。3、本文在FPGA上设计了提出的硬件加速器架构,并基于该架构实现了基于卷积神经网络的人脸识别以及数字识别算法。实验结果显示,该加速器每秒钟可以识别约3000张图片,相比于当前的主流CPU,本文提出的加速器实现了高达28倍的加速比;同时,相对于同类型的加速器,本设计在资源使用上降低了47%。
其他文献
针对山西省焦化产业的现状,为焦炉煤气综合开发和利用,提出了"组建以商品焦为主,生产化学产品和直接还原铁,形成焦炉煤气生产化学产品产业链和焦炉煤气生产直接还原铁产业链"
利用纤维素生产乙醇的研究中,传统的中温微生物在基质范围、酶活性及热稳定性等方面存在不足,难以满足工业需求.嗜热菌具有独特的降解纤维素、半纤维素和生产乙醇的耐高温酶
城市广场是城市设计的重要内容.文中通过分析南京六合茉莉文化广场的设计,讨论城市广场的地域文化表达,明确只有根植于本土文化的城市广场才是具有生命的,才是真正与人和谐的
<正> 1.概况 食用菌是景宁县的传统产业,1985年以来,我县积极推广木屑露地栽培香菇和高棚架栽花菇技术,生产取得了突飞猛进的发展。1986年到1997年,规模从2万袋发展到6238万
针对现有含锥套式混合室的高炉喷煤用烟气炉因混合室出口处温度超标而导致出口处钢架构易变形塌陷、内部耐材随之塌陷损坏的问题,提出了一种改进型高炉喷煤用烟气炉,该改进型
对山西焦化工业的现状及焦炭市场形势进行了较全面的分析,认为只有按照市场经济规律积极调整山西的焦炭生产结构,才能克服当前焦化工业遇到的困难,还提出了山西焦炭生产结构调整
目的 编制儿童期虐待史自评量表(PRCA),并对它进行初步的信度、效度分析。方法 对179例小学生进行了PRCA测试,分析PRCA的内部一致性,重测信度,内容效度及校标效度,并分析小学生的受
消费行为因素分析对产品生产和销售具有重要指导作用。C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法,先对消费数据集进行数据预处理,为了利用消费者的
目的:硫酸氨基葡萄糖联合玻璃酸钠对膝骨关节炎关节功能及炎性因子的影响。方法选择接受膝骨关节炎患者86例,随机分为对照组及观察组,对照组仅接受玻璃酸钠注射液治疗,观察组在此
目的探讨护士心理授权与工作倦怠的相关性。方法选取湖北省襄阳市3所三级甲等综合性医院的437名护士,采用心理授权量表、工作倦怠量表进行调查。结果分层回归表明,心理授权所解