面向软基带ASIP的物理层信号处理并行化研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:andyylaopo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动通信系统的快速演进,其空中接口的物理层信号处理技术不断更新,物理层信号处理对算法灵活性和处理器计算能力的要求推动了信号处理软硬件的联合发展。在硬件上,专用于通信信号处理的、支持软件编程的软基带专用指令集处理器(Application Specific Instruction Set Processor,ASIP)成为了物理层信号处理的一种合理的解决方案;在软件上,为了提高物理层算法的运算效率和系统误码率(Bit Error Rate,BER)性能指标,面向软基带ASIP的算法并行化成为了一种具有实际应用价值且不可忽视的软件技术。算法的并行化可以更加充分的利用ASIP的专用结构和专用指令集,通过数据级并行化(Data-Level Parallelism,DLP)和指令级并行化(Instruction-LevelParallelism,ILP)的方式,深层次地挖掘算法的并行度,成倍提高算法执行效率;或者利用并行化方式实现高性能、高复杂度的算法,提高移动通信系统的误码率性能指标。  面向软基带ASIP,从降低物理层链路处理时间和提高物理层误码率性能的角度出发,经过对OFDM(Orthogonal Frequency-Division Multiplexing,正交频分复用)通信系统链路在软基带ASIP上实现的分析,本文选取了其中具有关键性、耗时、且存在并行化难度的算法模块——ZC(Zadoff-Chu)信号产生、信号卷积(Convolution)和多输入多输出(Multiple-input Multiple-Output,MIMO)系统对数似然比(Log Likelyhood Ratio,LLR)产生算法作为主要研究内容。结合软基带ASIP的单指令多数据(Single InstructionMultiple Data,SIMD)和超长指令字(Very Long Instruction Word,VLIW)结构特点,对算法进行了深入研究和并行化设计。  针对ZC信号的产生,本文提出了一种基于根指数分解和少量种子序列组合的并行化算法,消除了ZC信号离散傅里叶变换(Discrete Fourier Transform,DFT)计算中的采样操作,并对种子序列的个数和长度做出优化,获得了良好的并行计算结构。ZC信号及其DFT的并行化产生算法在软基带ASIP上的计算效率分别达到了并行化抽样算法的4.8倍和4.6倍,而存储开销虽增加25%(4.7KB)和75%(14KB),完全满足软基带ASIP的片上存储容量限制,另外在工程上没有计算精度损失。该并行化算法已经应用于中科院计算所LTE(Long Term Evolution)基带SoC(System on a Chip)芯片。  对于信号卷积算法,本文分别提出了基2和基4的并行化短卷积算法,同时提出了基2和基4的专用并行化卷积指令,并通过VLIW结构对卷积的Overlap做出有效的计算处理。不同于传统并行化卷积算法的直接计算结构,本文提出的算法采用了并行短卷积计算结构,在软基带ASIP上具有极高的计算效率,基2和基4算法分别能够达到传统外循环矢量化(Vectorizing the Outer Loop,VOL)算法时间效率的2.5倍和4.3倍,并且在存储空间开销上能够与其基本持平,计算精度没有损失。与业界的专用数字信号处理器(Digital Signal Processor,DSP)中的专用算法相比,本文提出的并行化卷积算法指令周期的时间效率分别为TI C66x专用算法的1.5倍和2.8倍,达到业界先进水平。  对于MIMO系统LLR产生算法,本文提出了一种并行化半固定树搜索算法,利用Counter-ML路径权重进行LLR的计算,该算法利用符号调制中格雷映射(Gray Mapping)的特点和Schnorr-Euchner搜索策略,形成确定的运算量和规则的数据流,使得所有OFDM子载波的计算过程完全相同,从而能够以并行化的方式实现。本文提出的算法在2*2 MIMO和4*4 MIMO的条件下,不同符号调制方式下的误码率性能分别优于Bit-Flip算法2.6dB~3.9dB和2.3dB~2.6dB,时间复杂度则相应提高20%~40%和60%~90%,且能够在软基带ASIP的计算能力下完成算法执行。并行化LLR产生算法获得了良好性能和复杂度的平衡,使得高性能算法能够以较少的时间复杂度增加为代价在软基带ASIP上完成计算。  为了验证上述并行化算法的性能,本文基于软基带ASIP,利用提出的并行化算法对典型的OFDM移动通信系统物理层链路进行评估。结果表明,本文提出的算法能够获得链路级的总体耗时降低和误码率性能提升。一方面,本文提出的并行化算法在软基带ASIP上的实现具有极高的计算效率,对于2天线和4天线的数据发送过程,利用本文提出的并行化ZC信号产生和并行化卷积算法对原有并行化算法进行改进,链路总体耗时降低为原来的48%和46%;对于2*2 MIMO和4*4 MIMO的数据接收过程,利用本文提出的并行化ZC信号产生、并行化卷积和并行化LLR产生算法对原有并行化算法进行改进,链路总体耗时降低为原来的63%和79%;对于同步过程,利用本文提出的并行化ZC信号产生和并行化卷积算法对原有并行化算法进行改进,链路总体耗时降低为原来的29%。另一方面,本文提出的并行化算法能够将高性能、高复杂度的算法在软基带ASIP上的实现变为可能。针对2*2 MIMO和4*4 MIMO的天线配置,利用本文提出的半固定并行化LLR产生算法,能够在接收链路总体耗时仍然降低的情况下,数据接收过程的总体误码率性能分别提高了2.6dB~3.9dB和2.3dB~2.6dB。  综上所述,本文提出的ZC信号产生并行化算法、信号卷积并行化算法和MIMO系统LLR产生并行化算法对于移动通信系统中物理层信号处理在软基带ASIP上的实现具有重要意义和应用价值。
其他文献
WEBOOT在工作流管理联盟制订的XPDL规范和对象管理联盟制订的工作流管理规范的基础上,采用面向对象的分析和设计,使用设计模式优化设计,并采用面向对象编程语言进行实现,具有
学位
图像压缩在多媒体存储和传输中扮演十分重要的角色,小波变换因具有时域频域局部性、多分辨等性质在图像压缩中正在逐步取代DCT变换,并已得到广泛的应用。基于小波的图像压缩已
随着Internet以及电子商务的发展,人们对信息安全的需要越来越迫切。但是在传统的信息加密技术中,密钥的分发一直没有得到很好的解决,而基于公钥体制的PKI(Public Key Infrastru
信息加密的方式分别有软加密方式和硬加密方式两种.采用软加密方式时,密钥将会呈现在计算机的内存中,这将导致失密的可能.而采用硬加密方式时,密钥将不会、也不允许被计算机
计算机、无线通信和互联网的融合是当今技术发展的趋势之一,随着各种短距离无线通信技术的发展,人们提出了无线个人区域网(WPAN,WirelessPersonal AreaNetwork)的概念.蓝牙标
随着ATM技术的发展,宽带网络正成为通信网络的主流,但是在实现宽带接入之前,如何为现有的用户设备提供一个接入平台以利于它们接入到各种网络中,仍然是一个比较现实的问题.市
该文首先系统而全面地介绍了蚁群优化算法,包括其产生背景、算法基本框架及其应用.接着,我们将该算法应用于求解最大团问题——经典的难组合优化问题.通过对蚁群优化算法的一
随着云计算和多核/众核架构的飞速发展,数据中心中的资源利用率成为亟待解决的一个重要问题,当前数据中心资源利用率非常低的原因在于:由于资源竞争导致的性能干扰普遍存在,为了
无标记的3D人体运动捕获技术一直是计算机图形学与计算机视觉领域的研究热点,其成果被广泛应用于影视制作、游戏娱乐、训练仿真、医疗康复、安全预演等多个领域。但是,目前最好