基于GPU的LDPC增强准最大似然译码器的研究

来源 :东华大学 | 被引量 : 0次 | 上传用户：ran871229

【摘要】

：

【作者】

：

孔飞跃

【机构】

：

东华大学

【出处】

：

东华大学

【发表日期】

：

2020年期

【关键词】

：

GPU LDPC码增强最大似然译码器校验矩阵更新过程译码算法译码方案译码速度节点更新数据

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，为了满足新的通信需求，实现移动设备之间低时延、高速率和高可靠性连接，第五代（Fifth-Generation,5G）移动通信系统在数据信道和控制信道中引入了新的编码技术。低密度奇偶校验（Low-Density Parity-Check,LDPC）码由于其性能非常接近香农极限，已被确定为5G标准中的数据信道编码方案。因此设计一种高速率、高纠错性能的LDPC译码器对工程实践具有重要意义。
　　在LDPC码的置信传播（Belief Propagation,BP）译码算法中，同一类节点更新时可以并行处理，如算法中变量节点更新或校验节点更新过程中只需要关注校验矩阵中行或列中‘1’元素所在的位置，所以可以用现场可编程门阵列（Field Programmable Gate Array,FPGA），专用集成电路（Application Specific Integrated Circuit,ASIC）和图形处理器（Graphic Processing Unit,GPU）来设计LDPC码译码器，来提高译码速度。虽然基于FPGA和ASIC平台实现LDPC译码算法取得了一定的成果，但硬件平台的可扩展性和灵活性与软件平台相比较差，且硬件平台费用相对较高。而采用GPU实现译码方案可以较好地满足高扩展性、高灵活性和低成本的需求。尤其是近年来英伟达提出了计算机统一设备架构（Compute Unified Device Architecture,CUDA）平台，其卓越的处理能力使基于GPU实现LDPC译码算法可望具有光明的前景。
　　对于LDPC长码，校验矩阵中没有短环，在BP迭代译码过程中的变量节点输出的消息可以成功地收敛：而当LDPC码长较短时，校验矩阵存在大量的短环。因为短环的存在，使得各节点在译码迭代过程中存在相关性，从而导致消息在迭代过程中变得不可靠。所以短环的存在会造成译码性能急剧下降，不利于迭代算法的收敛。为了解决短环带来的译码性能的损失，一种准最大似然（Quasi-Maximum Likelihood,QML）译码器被提出来。这种译码器是在传统的BP译码失败后引入一种再处理（Reprocessing）过程，通过再处理过程消除大量导致BP译码器不收敛的伪码字。Kang Peng等人提出的增强准最大似然（Enhanced Quasi-Maximum Likelihood,EQML）译码器能在0.3dB的误帧率（Frame Error Rate,FER）范围内接近最大似然（Maximum Likelihood,ML）译码器的译码性能。但是由于这种译码器的复杂计算结构会造成译码时间大幅度增加。
　　为了解决EQML译码器造成的译码时间增加的问题，本文提出了一种利用基于GPU的CUDA平台来高效实现EQML译码器的解决方案，使用CUDA平台将EQML译码器中需要进行大量迭代的译码过程通过GPU多线程加速，达到提高译码速度的目的。本论文主要的完成的工作有：
　　（1）对于LDPC码的校验矩阵占据大量空间的问题，设计了压缩存储校验矩阵方案。通过压缩校验矩阵使得只用储存非零元素的索引信息，在译码过程中通过索引得到非零元素在校验矩阵中的位置，既能节省GPU上的内存空间又能提高数据处理速度。
　　（2）对于BP译码算法校验节点和变量节点更新过程存在计算复杂度高的问题，设计了对BP译码算法重新排列的译码方案。重新排列后的算法不仅可以降低变量节点和校验节点更新过程中计算差集带来的循环和判断计算的时间复杂度，还可以在更新过程中采用最大量的线程进行计算，同时可以利用GPU的合并访存机制提高数据的访存速度，这种方案既能降低译码算法的复杂度又能利用GPU内合并访存机制。
　　（3）对于EQML译码器再处理过程中每个阶段码字间译码的不相关性，利用GPU采用多码字并行译码方案提高译码速度，这样可以充分利用GPU的多线程的优势，避免了基于CPU的EQML译码线程瓶颈。
　　（4）利用GPU内不同储存器访存速度不同的特点，设计了把译码迭代过程中需要进行频繁读写的数据存储在带宽更高的共享存储器中的方案，加速数据的读写速度。同时对于那些只需要进行读操作的数据，把它们存储到GPU内只读存储器即常量内存中，充分提高了译码器的处理速度。
　　（5）设计了利用GPU内有独有的页锁机制，降低可分页内存在进行译码时对数据进行两次复制引入译码延迟的方案。利用GPU内流并行机制，使通过深度优先的任务调度次序，降低数据在CPU与GPU之间通过PCI-E总线传输时的空闲等待时间。
　　（6）最后，对本文提出的GPU实现方案下译码器的加速效果与CPU串行实现方案进行仿真对比，对能够影响译码器译码速度的因素：信噪比、码字长度、再处理最大阶段数等进行了对比实验。
　　通过研究表明本文设计的基于GPU实现的EQML译码器与CPU实现方案相比能够带来接近两个数量级的速度提升。大大提高了译码器的译码速度，为未来LDPC码在5G领域的进一步应用提供了支撑。

其他文献

基于自混合神经网络的小样本数据人脸识别方法研究

图像特征提取和融合是将图像中的特征提取出来，并使计算机能够据此分辨图像中不同物体的过程，是深度学习图像识别领域中研究热点方向。现有较为成熟的方法是卷积神经网络，但其训练样本不足的情况下，会在深度学习框架训练过程中出现过拟合、难拟合问题，从而降低了准确率。本文针对小样本情况下，卷积神经网络准确率不高的问题，通过改进卷积神经网络训练流程，以及设计特征提取和融合算法，提高了在小样本情况下人脸识别的准确率。主要内容如下：
　　第一，介绍深度学习图像特征提取和融合关键技术，主要内容包括人工神经网络、BP算法和

学位

混合神经网络小样本数据人脸识别图像特征提取卷积神经网络深度学习特征图训练准确率图像识别数据依赖问题

“园中的野味”

枸杞的药用价值已久为人知，其根、果、叶含有甜菜碱和十几种人体必需的氨基酸及多种维生素，而且富含钙、铁、锌等多种人体必需的微量元素。具有明目、降血压、润肤养颜等作用及防癌抗癌的功效，也是糖尿病人的美食。《食疔外草》中认为其"坚筋耐老，除风，补益筋骨，能益人，去虚劳"。而其更具有价值的还是它的药食兼用性。有资料一再显示，枸杞嫩芽比枸杞果更富含营养成分，更易于结合日常饮食达到食疗和保健目的。　　枸杞芽味

期刊

浅论商业银行金融创新

【摘要】商业银行的金融创新已成为银行业发展的显著特征。在商业银行业务创新过程中，不可避免地存在一些问题，解决商业银行金融创新的途径是：创新的着眼点要立足于市场及客户；创新的方式应以原创型为主；要建立有效的金融创新机制；提高产品和服务的科技含量；加强创新产品的营销力度；挖掘金融创新的整合力量。　　【关键词】银行；金融；创新　　金融创新自20世纪60年代初兴起以来，得到迅猛的发展，实践已经证明它的积

期刊

中国特色社会主义宣传教育创新方式探析

【摘要】领导魅力是领导者在领导活动中表现出来的品格、才能、学识、情感等对被领导群体所产生的一种非权力影响力。而领导干部脱稿讲话水平的高低，在一定程度上成为人们评定其领导魅力和领导素质的重要方面。本文援引大量实例，从“独善其身、厚积薄发”， “不落窠臼、开拓创新”，“情系百姓、与民共舞”，“丰富语言、独具特色”四个维度深入剖析，致力于通过增强领导干部脱稿讲话的能力进而提升领导魅力。　　【关键词】领

期刊

电磁式MEMS微镜的控制方法研究

微光机电系统（Micro-Opto-Electromechanical System,MOEMS）是微机电系统的一个重要分支，是指由微光学和微电子技术交叉而成的一种新型微机电系统，集微传感器、微执行机构和信号处理电路于一体的微型器件。
　　MEMS微镜是一种典型的微机电系统，具有集成度高，体积小以及功耗低等优良特性，已经逐渐应用于食品检测、医疗设备、光通讯以及消费电子等领域。作为一个新兴的研究领域以及其良好的应用前景，关于MEMS微镜系统的控制研究受到学者的广泛关注。
　　本文以电磁驱动微镜作

学位

电磁式MEMS微镜无模型控制微机电系统模型算法最小二乘算法信号处理电路微光机电系统逆模型改进分析微电子技术

基于机器学习的用户偏好预测推荐模型研究

随着移动设备的普及和基础通信设施的建设完善，尤其是5G通讯的商用，互联网，物联网，云计算将得到高速发展，伴随而来的是数据量的爆发式增长。大量的有价值的信息湮没在了没用的冗余数据中，远远超出了大众用户的所能承受的数据量，严重阻碍了信息的有效传播。由于数据的信息过载，要为用户找到相关的、吸引人的和有用的内容变得越来越困难。作为解决信息过载的有效手段，推荐系统受到了大量研究人员的广泛关注。近年来，广大学者提出了许多的优秀的推荐算法模型，在推荐效果上有一定的提升。传统的推荐算法简单易行，但是偏好预测的精度不高，很

学位

机器学习用户偏好预测性能数据集协同过滤推荐算法推荐模型信息过载极限学习机基于用户的协同过滤向量物品评分

基于深度学习的夜间无人车目标检测与跟踪

无人驾驶技术能够给交通出行带来很大的便利，实现无人驾驶的首要技术便是无人车环境感知。基于图像的视觉感知是实现无人车感知的一个重要途径，无人车在白天场景下能够依靠可见光相机很好地感知外部环境，但在夜晚或者黑暗无光的情况下可见光相机不能对周边环境进行感知，红外热像仪通过感受环境的热量分布成像，在非常规环境（夜晚或者黑暗无光的场景）下有着出色的表现，但红外图像相比于可见光图像有纹理度低、噪声多、无颜色信息等劣势。为了使无人车能够在夜间也安全行驶，针对红外图像的目标检测与跟踪研究尤为重要。
　　本文主要针对

学位

深度学习夜间无人车目标检测算法红外图像特征图无人驾驶卡尔曼滤波语义信息匹配算法多目标跟踪算法可见光相机

工程档案在民生重点项目中的应用

【摘要】本文结合全国最大的易地安置暨保障住房项目——民生尚都，开展工程档案管理实践为例，着重分析了工程档案在民生重点项目实际应用的现状、存在的问题，提出了相应的对策，得出民生重点项目应加强工程档案管理的结论。　　【关键词】民生；重点项目；工程档案　　工程档案作为项目建设全过程原始、真实的记录，是宝贵的信息资源，更是一种潜在的生产力[1]。通过对它的管理、开发和利用，可极大地推动以民生重点项目为代

期刊

基于EEG信号的大脑认知负荷水平研究

当今社会信息越发多元化以及复杂化，对于大脑负荷水平的研究能够帮助人对于心理精神状态有更好的把控，比如监测驾驶员大脑负荷水平能防止车祸；监测高危行业工作人员的注意力集中程度能防止重大安全事故的发生。目前通过脑电信号（EEG）进行认知负荷的监测是最常用的手段。在深度学习成为热点之前，基于CSP（共空间模式）的算法是较为流行的分类认知负荷的方法。随着人工智能方法的普及，通过将神经网络应用于大脑认知负荷领域，分类准确率得到了很大的提高。本文运用深度学习的方法对EEG进行了特征提取以及分类。研究工作及创新点主要分为

学位

EEG信号脑认知认知负荷并行机制负荷分类神经网络大脑准确率深度学习三通道参与者特征提取

市政给水管网的应用

【摘要】由于我国地域辽阔，各地区的地形、地质差异较大，管材的应用各不一致，新型管材也不断在发展，形成目前市场给水管材品种繁多，让选用者眼花缭乱。管网叠压供水是我国近些年来迅速发展的二次加压供水方式，工程建立了完善的质量管理体系，对于管材从出厂——运输——保管——埋设——运行整个过程进行了严格的把控和掌握，确保了每一条管道的质量可靠，其对于破损管道的修复处理措施，也对类似的工程具有借鉴意义。　

期刊

基于GPU的LDPC增强准最大似然译码器的研究

其他学术论文