基于嵌入式深度学习的信号识别

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:zzzzzzvb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着世界更加数字化、信息化,人们开始渴望通信系统领域的相关技术应用可以更加智能化。近年来,一大批深度学习研究学者将目光逐渐深入到军事雷达通信和卫星导航等领域,不断地有基于深度学习的信号调制识别、载波信号检测等算法被提出。然而,深度学习算法复杂,运算起来通常比较耗时。在对相关技术的实际应用中,人们还是希望可以在小巧易携带且节能环保的嵌入式设备上实施操作,并希望能够在低功耗的嵌入式设备上,更快地实现对深度学习算法的推理运算。本文以嵌入式设备为实验平台,以信号识别深度网络算法为加速对象,研究深度学习神经网络在嵌入式设备上的加速优化方法。本文对基于深度学习的通信信号识别网络的网络结构和网络中所包含的各种网络层的原理和结构进行了简要说明。本文还对信号识别深度网络的层间并行进行可行性讨论,以确定并行方针,随后对网络中各网络层所包含的并行性进行分析。为后续在嵌入式设备上的网络并行加速工作提供了理论支持。本文首先以NVIDIA Jetson TX2这款嵌入式GPU(Graphics Processing Unit,图形处理器)作为加速实验平台,在研究了这款设备基于CUDA的并行加速实现方式之后,深入学习了CUDA对NVIDIA GPU的优化加速方法。然后在TX2上进行了一系列对信号识别神经网络中卷积层的异构加速优化实验,最后在一维的工作空间并设置工作组为256后取得了最优的加速效果为75.719ms,是多核处理器的2.1倍运算速度,然后在TX2上对信号识别神经网络的所有网络层进行异构并行加速推理,经过并行加速后,整个网络的耗时为78.166ms,运算速度是多核处理器的2.65倍。本文还在DE5-NET这款嵌入式FPGA(Field-Programmable Gate Array,现场可编程门阵列)设备上进行了信号识别神经网络的并行加速优化实验,使用Open CL这个通用异构并行框架来完成并行任务。同样,先在DE5-NET上通过使用不同的优化方法来对卷积运算进行并行加速优化实验,实验得出使用二维的工作空间并进行十流水线复制的优化措施可以取得最佳的运算耗时45.882ms,是多核处理器的3.5倍运算速度,并将整个信号识别网络的所有层都放在DE5-NET上做并行加速,整个网络的耗时为60.001ms,运算速度是多核处理器的3.45倍。
其他文献
阵列天线是由多个辐射单元排列而成,若其中某些阵元失效将会导致阵列性能下降。为了保持阵列的辐射性能,对阵列进行定期或实时的故障诊断尤为重要。本文以基于辐射远场信息的阵列故障诊断方法为研究课题,从多标签分类的角度建立诊断模型,结合机器学习相关技术,对基于多标签深度学习的阵列故障诊断方法以及基于迁移学习的平面阵诊断网络展开研究。本文的研究内容主要包含以下三个部分。1.现有的基于机器学习的阵列故障诊断方法
随着网络化应用程度的加深,互联网+、大数据等技术的发展迅猛,现代社会也会产生大量多维度多属性的数据,例如医疗图像数据,工业传感器数据,高光谱图像数据等,传统的低维信号已经不能表现这些数据多个属性的内在联系,所以这些具有高维特征的数据集一般都用张量来表示。张量作为向量和矩阵在高阶空间的延伸,是这类数据十分本质的表达。张量奇异值分解(T-SVD)是一种新颖的分解方法,可以通过傅里叶变换把数据从时域搬移
随着社会和科技的不断发展,对于监控视频场景的智能分析系统的需求也不断的上涨。在众多的监控视频分析功能中,对视频中的人员进行定位以及计数是一个重要的研究方向。本文基于深度学习的理论,利用多任务学习的方法设计了一个可用于图像中人员定位以及计数的多任务学习模型,然后结合后处理算法进一步提高系统的精度。本文主要进行了以下的工作:1)对系统应用场景的视频数据做了收集、划分、标注,从图片数据的场景出发,说明了
人工电磁超表面由于其独特的电磁特性而受到人们的关注,其应用范围很广泛,常见于天线、雷达和多种电磁功能器件。在进行电磁超表面设计时,往往需要用到电磁仿真软件对其进行结构建模、仿真计算和参数优化。当结构较为复杂时,这是一件非常耗时的工作。如何对复杂超表面结构进行快速设计,成为了超表面技术研究领域的一个重要课题。近年来,随着人工智能技术的快速发展,一些专家学者引入深度学习的思想,构建神经网络对超表面的结
磁场传感器的应用十分广泛,在国防建设、科学技术、医疗卫生等领域都发挥着十分重要的作用,是传感器产业的一个主要分支。AMR线性磁场传感器因其灵敏度高、工艺简单、易于集成、成本低、噪音小等优点,是应用最为广泛的磁场传感器之一。AMR线性磁场传感器的性能除了受制备工艺的影响,还受几何参数设计的影响。目前国内的研究主要集中在薄膜材料和工艺上,在传感器的尺寸设计方面研究还较少,因此本文主要研究不同的设计参数
太赫兹波位于微波和红外波之间,具有瞬时性、光子能量低、高穿透性等优良特性,可应用于高灵敏度检测、高精度成像和无线通信等领域。由于太赫兹电磁波不会对生物组织产生负面的电离危害且很多生物大分子在太赫兹波段具有较强的集体震荡,可以增强对生物分子检测的灵敏度,随着太赫兹频谱技术的发展,太赫兹波在生物传感方面的研究成为一个重要方向。超材料(metamaterial)是一种具有特殊的物理特性的人工复合电磁材料
三维霍尔传感器是为了满足现代产业的极速发展而出现的。现在的三维霍尔传感器大多由硅材料制成,其具有良好的工艺兼容性,但由于硅材料的载流子迁移率低、禁带宽度窄,基于硅的霍尔传感器的灵敏度较低、温度稳定性较差。GaAs材料的载流子迁移率高、禁带宽度大,用其制备的霍尔传感器具有更高的灵敏度与更好的温度稳定性,并且可以利用GaAs基异质结的高迁移率载流子特性来进一步提升传感器的性能。本文首先对GaAs基异质
在过去的几年时间里,4G的普及推动着移动互联网行业的飞速发展;可以预见在未来的几年时间中,5G的全面铺开也必将会给物联网带来新的发展。随着网速越来越快,人们对信号传输过程中的编译码时延要求也越来越高。近些年深度学习在很多领域已经取得了重大的突破,也越来越多地被应用于各行各业,其“一次训练到处推理”的特点非常适合用来处理信道译码任务。利用深度学习,在神经网络中学习到某种编码的特征,将带有这种特征的模
近年来,视频作为可视媒体数据的重要组成部分深深影响着人们的生活。视频信号在产生、传输过程中常受到噪声的影响,给用户带来不良的视觉体验。视频去噪是提升视频质量的有效手段,并且是视频处理领域的热点研究问题之一。近年来,基于经典信号处理方法的视频去噪已经遇到了技术瓶颈,基于深度学习的去噪方法正成为主流的视频去噪方法。基于深度学习的视频去噪方法虽然带来了去噪性能的显著提升,但仍无法充分利用视频内部的先验信
在已经步入信息时代的今天,我们的生活中每时每刻都在产生着不计其数的视频数据。而在安防领域,覆盖城市的监控摄像头网络,每天在保卫着人们的生命与财产安全的同时,也会产生大量的监控视频数据。在发生事故后,监控视频通常是用于还原事故原因、追查嫌疑人的有效法宝。但覆盖整座城市的监控网络,其产生的视频不仅数量巨大,而且并非全部视频都包含有用的信息,在人群稀疏处的监控摄像头可能拍摄的大部分视频都是背景。大量的监