面向卷积神经网络的硬件加速器设计方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zqfc2058
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为满足实际应用对卷积神经网络(CNN)推理的低时延、小体积和高吞吐率等要求,设计了一个采用如下优化方法的加速器:针对外存访问带宽限制,基于设计空间探索确定循环分块因子以最大化数据重用;针对CNN计算密度高,采用循环展开技术充分挖掘四种计算并行度;内存池、乒乓缓存和动态数据量化等技术用于管理片内外存储资源。将生成加速器流程封装为CNN加速框架;采用生成的加速器实现了AlexNet网络,仿真结果表明,该设计最高可达1 493.4 Gops的计算峰值,是被比较工作的多达24.2倍,DSP效率也超过了其他设计方法
其他文献
摘要:为提高断裂弹性动力学问题数值计算的精度,避免出现病态或奇异方程组,基于改进的移动最小二乘法建立三维弹性动力学问题的积分弱形式,采用罚函数法施加位移边界条件,引入隐式时间积分并且结合三维断裂力学的形函数考虑裂纹尖端的奇异性,探究将改进的无单元Galerkin(improved element-free Galerkin, IEFG)法用于断裂弹性动力学问题的数值计算。通过悬臂梁、柱和矩形板等3
摘要:为分析汽车轴距和轮距设计对操纵稳定性的影响,建立高速公路横向坡道转向行驶的汽车转向动力学模型,并在MATLAB/Simulink软件中建立相应的仿真模型。采用某型汽车设计轴距和轮距进行仿真,得到以不同速度在不同横向坡度道路上转向行驶时的横摆角速度、侧向加速度和质心侧偏角。根据该型汽车的转向特性和侧翻阈值评价其在高速公路横向坡道转向行驶时的操纵稳定性,结果表明该型汽车的设计轴距和轮距满足操纵稳
摘要:为更精确地评价新车型行人保护头部碰撞的性能,提出一种新型头部碰撞模型构建方法。该方法基于传统头部模型,根据摩擦理论和试验经验,推导接触压力和接触面相对速度与摩擦因数的复合关系式,通过头部模型跌落冲击试验标定复合摩擦曲线参数,得到与真实行人头部吻合度更高的新型头部模型。某车型行人保护头部碰撞仿真计算表明,使用新型头部模型可极大地提高仿真的准确性。新型头部模型建模方法适用于不同法规对头部模型的要
摘要:为实现更加先进的拓扑优化算法,研究采用反应扩散方程的水平集结构拓扑优化方法,通过理论推导给出算法中的参数选择建议。该方法允许在拓扑优化过程中生成新的孔洞,初始结构无须包含孔洞,不需要重新初始化步骤,从而可提高算法的收敛性。针对传统拓扑优化中主要采用体积约束、以柔度最小为目标和体积保留率设定存在一定主观性的问题,探究不同体积保留率下的结构应力水平的变化规律,结果显示可以依据结构最大应力水平与体
摘要:为探究火灾下超高性能混凝土(ultra high performance concrete, UHPC)梁斜截面承载性能的退化与损伤演化规律,采用Abaqus建立16个UHPC梁的热-力耦合分析模型,选择剪跨比、载荷水平、配箍率、箍筋配置方式、纵筋配筋率等作为考察参数,通过与试验结果对比验证模型的正确性。火灾下UHPC梁斜截面承载性能削减严重,其破坏延性优于普通混凝土梁。载荷水平和箍筋配置方
摘要:为研究支吊架用卷边槽钢压弯构件的稳定性,采用有限元法进行屈曲模态仿真试验,分析截面尺寸、偏心距、长细比等因素对构件屈曲模态的影响,并与《冷弯薄壁型钢结构技术规范》(GB 50018—2002)中稳定性计算公式的结果进行对比,结果表明:随着腹板高度和板厚的增大,稳定承载力增大;随着偏心距和长细比的增大,稳定承载力降低;构件均未出现局部屈曲与畸变屈曲。有限元法得到的稳定承载力与《冷弯薄壁型钢结构
摘要:针对注塑成型生产过程工况多而难于质量监测的问题,利用统计模量(statistics pattern, SP)简化数据结构、避免复杂的数据预处理,采用支持向量数据描述(support vector data description, SVDD)算法解决多模态问题,并提出一种基于SP-SVDD的多工况注塑成型质量监测方法。以螺杆位移和模腔压力为样本数据的采集对象,提取过程数据的SP并建立SVDD
摘要:为分析既有建筑增设电梯的冷弯薄壁型钢框架电梯井道的抗震性能,采用有限元法建立电梯井的抗震分析模型,考虑结点初始刚度和是否增设斜撑的影响,分析在多遇地震波和罕遇地震波作用下电梯井各楼层的响应。计算结果发现:随着结点初始刚度的减小,电梯井框架结构各楼层位移、层间位移和自振周期逐渐增大,但基底剪力和对既有建筑的作用力降低;半刚性结点有一定的耗能作用,在满足结构抗震要求时可适当考虑半刚性连接;适量增
收稿日期:2021-[KG*9〗05-[KG*9〗18  作者简介:  冯超(1998—),男,安徽芜湖人,硕士研究生,研究方向为锂电池电极材料扩散、反应应力及其耦合本构关系,  (E-mail)F_chao@tongji.edu.cn  1 如何在Adams view中设置弹簧的非线性刚度?  首先,通过file/import/file type → test data/create splin
摘要:为合理设计肋板外保温结构2层保温材料的厚度,采用稳态热平衡理论计算初步确定厚度方案,采用Abaqus软件对外保温结构进行仿真分析,结果认为规则部位内保温层与外保温层之间的界面温度满足工程要求,验证理论计算的合理性。保温层圆角过渡部位内保温层与外保温层之间界面温度不满足设计要求,采用Abaqus优化模块对局部尺寸进行优化计算,确定该部位2层保温材料的厚度分布,得到满足设计要求的外保温层厚度组合