【摘 要】
:
伴随着3D视觉时代的到来,衍生了各种形式的3D卷积神经网络框架,并开始广泛地应用到生活当中。其中,点云数据是一种重要的三维数据形式,其可以非常直接并且简洁的表示三维物体模型。因此,基于点云数据的卷积神经网络的研究是研究者们的重要方向之一。随着计算机技术以及半导体芯片的迅猛发展,为卷积神经网络模型和数据处理提供了高能效,高速的计算资源。FPGA或专用芯片的卷积神经网络加速器的发展更是推动了神经网络模
论文部分内容阅读
伴随着3D视觉时代的到来,衍生了各种形式的3D卷积神经网络框架,并开始广泛地应用到生活当中。其中,点云数据是一种重要的三维数据形式,其可以非常直接并且简洁的表示三维物体模型。因此,基于点云数据的卷积神经网络的研究是研究者们的重要方向之一。随着计算机技术以及半导体芯片的迅猛发展,为卷积神经网络模型和数据处理提供了高能效,高速的计算资源。FPGA或专用芯片的卷积神经网络加速器的发展更是推动了神经网络模型可以更加广泛地在各种移动设备上使用,其在体积,功耗等方面都相对于CPU,GPU等有很大的优势。近年来的特定领域架构的FPGA或专用芯片如谷歌的TPU,昇滕AI处理器等在2D图像处理,声音以及信号处理上的应用已经非常广泛且非常有效。但是点云数据具有无序性,刚体变化不变形以及点与点之间具有相关性等特点,这与传统图像相比具有较大的差异,因此主流的卷积神经网络加速器很难在处理点云数据上达到较高的性能。针对以上问题,本文通过分析点云数据以及点云卷积神经网络的架构特点,实现了一个基于3D点云数据的神经网络加速器。感受野是卷积神经网络研究中的一个重要概念,其为决定某一层的输出结果的一个元素对应原始模型输入数据的需要的区域的大小。当卷积神经网络模型的输出或模型的部分子网络的每个输出元素对应的输入的感受野确定时,可以只向内存访问对应的感受野的数据,直接计算得到该模型或子网络的输出。减少模型内或对应子网络内部的各层数据的访存。近年来,卷积神经网络硬件加速器设计成为超大规模数字芯片设计的热点之一。在这些设计中,内存访问及其带宽是一个关键方面。顶尖的硬件加速器如TPU,昇滕AI加速器等采用了多级,高容量,复杂的片上缓存系统,来减少内存访问以及系统带宽。而本文通过利用点云卷积神经网络的感受野性质,优化数据通路,减少内存访问,同时降低片上存储的容量。本文设计了一个基于感受野的多层层内并行加速架构,通过对点云的部分点进行连续处理多层的计算。由于每层处理的点数较少,将中间结果全部缓存在片上的存储模块,直接进行下一层的计算。解决了数据带宽的问题,同时大大减少了片上缓存的容量,提高了单位片上缓存的效率,同时加速器集成了512个乘法器用以卷积计算,可以同时处理512个乘法运算,大大提高了硬件加速器的计算性能。本文设计的点云卷积神经硬件加速器在Zynq7z045平台上对Point Net模型进行加速验证测试。最终,本文设计的加速器的计算性能为21.14GOPS,功耗为3.49W,片上缓存容量为295.68KB,使用了513个DSP。与CPU和GPU相比,计算性能分别为GPU和CPU的3倍和5倍,同时,计算性能能效比是CPU和GPU的33倍。与近年来其他加速器相比,本文的单位DSP计算性能和单位频率性能都较高,其中单位缓存性能表现最高达0.072GOPS/KB。
其他文献
医学超声是一种在临床实践中广泛应用的成像模态,因其实时、廉价、无害等独特的优点,发展迅速。近年来,随着深度学习在计算机视觉领域的发展,超声图像分析中深度学习也得到广泛的应用,并取得了巨大的成功。如在病灶/结节分类,器官分割,胎儿标准面检测等任务中,基于深度学习的方法都取得了超越传统手动特征提取的方法的性能。然而传统深度学习中采用的深度神经网络多通过专家手动设计,这是一个试错的过程,高度依赖专家经验
包虫病是一种由于人类感染棘球蚴而引起的寄生虫病,准确的包虫病诊断和分型对后续的治疗至关重要。包虫病患者广泛分布于全世界,尤其是中国西部牧区和半农半牧区。由于牧区地广人稀,专业医生不足,包虫病患者得不到及时的诊断和有效的治疗。超声是临床诊断肝包虫病最常用的工具。然而,大面积的肝包虫病筛查工作耗时耗力,并且肝包虫病的诊断非常依赖于医生的个人经验。因此,为了提高肝包虫病的筛查和诊断效率,缓解牧区医生不足
心脏病作为全球范围内患病率和死亡率最高的疾病之一,严重影响了患者的生活质量,同时也对各个国家的医疗体系造成了重大负担。作为临床实践中心脏功能评价的金标准,心脏磁共振图像(Cardiac Magnetic Resonance,CMR)在临床中被大量使用。特别是近年来机器学习技术的发展,使得计算机辅助诊断(Computer aided diagnosis,CAD)技术的使用通常在大量样本上可以取得整体
随着集成电路的不断发展,市场对电源管理类芯片的需求越来越大。在开关电源中,如何提升效率是一个非常关键的研究方向。近些年随着电路规模不断增大,低压大电流应用成为当今小功率开关电源的趋势所在。传统的二极管整流由于正向导通压降较大,会极大地降低电源效率,因此采用同步整流技术,也就是采用通态电阻更小的功率MOS管代替二极管进行整流,可大幅减少整流损耗,提高转换效率。本文设计了一款适用于反激式AC-DC转换
睡眠质量的好坏与人们的学习生活以及身体健康有着很密切的关系,多数人患有睡眠疾病却难以自身察觉。当前睡眠医学领域面临的一个重点问题是如何能够有效地对人体夜间睡眠质量进行综合评价。目前,睡眠医学界认定的评价整夜睡眠质量的公认标准仍是多导睡眠监测系统。可采用相关商用设备主要的问题是传感器过多,影响整体的评价结果,且监测过程繁琐,容易给患者造成一定的心理压力。另一方面,这类设备的自动分析诊断功能和易用性等
脊柱侧凸发病率高达4%,对于脊柱侧凸疾病的诊断和治疗需要医学影像技术的辅助。在临床应用中,最常用的检查手段是医生手工测量X光正位片中脊椎侧弯角度(Cobb角)。但利用X光检查存在3个不足之处:一是椎旁肌不对称是导致和加剧脊柱侧凸的主要原因,测量评估椎旁肌畸变情况也是进行脊柱侧凸的诊断和康复的主要依据之一,但是通过X光片并不能了解肌肉的具体情况;二是X光具有辐射,对于人体会造成一定的危害,不适合作为
在产前超声检查中,医生常常需要测量相关的参数来预估胎儿的生长发育情况。而获取标准切面是医生准确测量的前提,其中本文研究的丘脑水平切面的双顶径和头围参数被来预测胎儿的体重,是孕妇选择最终的妊娠方式的关键参考参数。然而,目前的标准面的获得多依赖超声医生的临床经验,存在很大的主观性且容易得到质量较差的超声切面。临床上,由经验丰富的专家超声医生来评估新手医生的超声图像质量,但是非常费时耗力,占用临床专家资
肢体偏瘫作为脑卒中常见的后遗症,可以通过长期的重复性训练提升肌肉机能。当前康复科室常见的上肢辅助运动方式多采用康复治疗师帮助运动,但是这种康复模式单一且低效,为了优化医疗资源配置,少数大型医院也引入了上肢康复机器人。上肢康复机器人能够帮助患者实现稳定、有效的运动训练,但它们常采用引导性或特定模式下的被动运动,缺乏对患者主动运动意识的提取和应用。因此,本文基于已有的上肢康复机器人技术,提出并设计一种
锂离子电池具有能量密度高、库伦效率高、使用寿命长和自放电率低等优点,作为优异的能量存储及转换设备已广泛应用于便携式电子产品、各类交通工具和大型储能设备等领域。在锂离子电池中,隔膜是关键组成部分之一。锂离子电池隔膜是一种微孔型结构的高分子功能性隔膜,具有隔离正负极的功能,其大量曲折贯通的微孔结构能让电解液中的电解质离子自由通过。而传统商业化聚烯烃隔膜存在热熔化温度较低、热闭孔性能较差、电解液吸附及浸
喉疾病的种类多样,如近几年发病率逐渐增高的声带息肉和声带小结,会对人们的发声和呼吸功能造成影响,严重的还会导致癌变。喉内窥镜检查是目前临床上诊断喉疾病的主要方式。随着喉镜图像的数字化和可存储性的发展,基于喉镜图像的计算机辅助诊断技术开始被研究和实现。而声门分割则是对喉镜图像进行自动分析的重要前提。声门指的是喉部两条声带之间的区域。声门的形态反映了声带的状态,在喉疾病的诊断中起着重要作用,精确的声门