基于强化学习的认知无线电动态多信道接入方法研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:lx90
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频谱接入是认知无线电技术中非常重要的一环,要求在不干扰授权用户使用的前提下,根据频谱感知得到的结果接入空闲频谱并利用。动态多信道接入可以在时变的频谱占用状态情况下,实时动态地调整自身设备参数,自主选择接入空闲频谱资源。深度强化学习作为解决动态系统问题的有效方法在无线通信领域里被广泛采用,其区别于传统方法,不需要系统环境的先验信息,与系统环境不断交互获得相应的奖励与惩罚、不断学习环境的动态特征信息。同时深度强化学习能解决复杂状态空间问题,并有较高性能表现。将深度强化学习应用在动态多信道接入中,可使非授权用户对可能出现空闲的信道进行跟踪、学习和更新,智能地选择信道检测集合,从而提高频谱利用率,满足自身通信的需求。本文针对单用户动态多信道接入问题,考虑非授权用户感知能力的局限性及授权用户占用频谱的时变性,该问题归类为部分可观察马尔可夫决策过程(Partially Observable Markov Decision Process,POMDP)。基于该POMDP,本文采用双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient,TD3)来解决单用户动态多信道接入问题,TD3采用双Critic网络和双延迟更新等优化方法,能学到更优的感知接入策略。仿真结果表明该算法均优于深度Q网络(Deep Q-Network,DQN)、深度双Q网络(Double Deep Q-Network,DDQN)、深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG),提高了非授权用户的接入成功率。在真实的认知无线电系统中,往往存在多个非授权用户共享信道资源。然而,在以往的工作中,非授权用户采取基于独立策略的信道接入方法,即视其他非授权用户为环境的一部分,违背了强化学习静态环境且具有马尔可夫性的假设。因此,独立决策的强化学习算法不能较好解决多用户动态多信道接入问题。本文建模了满足多个非授权用户带宽约束的多用户动态多信道接入问题。然后,提出基于多智能体TD3(Multi-agent TD3,MATD3)的多用户多信道接入算法,采用集中化训练与分布式执行感知接入决策,从而减少系统非静态的影响。实验仿真结果表明,提出算法的性能胜过多智能体DDPG(Multi-agent DDPG,MADDPG)、独立策略的TD3和DDQN算法,提高认知无线电系统下非授权用户的整体接入成功率。
其他文献
在大数据时代,很多数据具有重要的商业价值,需被长期的保存与共享,这就需要赋予数据相应的标识并根据该标识持久解析数据的所在位置。目前广泛采用的标识解析系统是域名解析系统DNS。然而,传统的基于域名解析系统的DNS标识由于其解析结果僵化、安全保护意识薄弱、标识主体单一、不可控等特点已无法满足现阶段大数据发展的需求。Handle系统作为对标DNS的一种标识解析系统,具备自主可控、国际接轨等特点,在安全性
环境污染和能源危机使得诸如风电、光伏之类的可再生能源技术以及作为燃油汽车替代品的电动汽车等新能源技术在国家政策和人们逐渐苏醒的绿色环保意识下迅猛发展,可再生能源的装机容量以及电动汽车(Electric Vehicle,EV)的规模都不断扩大,系统运行问题也随着参与主体的增加变得更为复杂。本文分析了EV的入网影响,以含EV的交直流混合微电网为研究对象,考虑系统内的不确定性建立了鲁棒优化模型,并考虑电
随着空客A380商用飞机、波音B787商用飞机、以及F-35战斗机的出现,多电飞机(More-Electric-Aircraft,MEA)已成为未来飞机的发展趋势,多电飞机谐波污染问题同时也引起了航空界的广泛关注。三相变频交流发电机具有系统结构简单、发电效率高、体积重量小等优点,广泛应用于新型多电飞机,其输出电压频率在360Hz~800Hz范围内变化,最大频率变化可达400Hz/s。并且,在实际应
风力发电是目前发展最快的可再生能源行业之一,以其开发技术成熟,最具规模化,被广泛应用于发电领域。我国大部分地区风资源充足但风能密度低,因其地形为山地和丘陵,相较于可供集中连片开发的海上风电场与平原风电场,山地风电场的建设成为必然趋势。与普通风电场不同,山地风电场存在以下几个特征:1)风电机组分散、运行模式均不相同;2)集电电缆密集;3)集电网络复杂。一方面,集电网络与密集的集电电缆将导致系统中感性
弓网系统是牵引系统中的重要设备,对其进行智能检测有助于保证弓网系统运行的安全性及稳定性。弓网图像数据是弓网智能检测的基础条件,因此图像数据的生成与增强技术有着重要研究意义和研究价值。本文根据收集弓网图像不同特点设计了两种弓网背景转换思路,这些转换图像增加了弓网数据的完备性和多样性。根据黑夜中弓网图像信息单一、弓网轮廓清晰的特点,本文先使用U-net分割出原图像中的弓网,再使用泊松融合将分割出的弓网
近十年,我国高速铁路迅速发展,在高寒地区已接通并规划多条主干高铁,如哈大高速铁路、兰新高速铁路等。随着高寒地区高铁覆盖率提升,保障高铁运营安全至关重要,其中首要任务便是确保高铁牵引供电系统不间断供电。该系统作为高铁唯一动力能源,牵引变压器是其中的关键设备,而变压器附属高压套管负责将高低压引线从变压器内部引出并与外界电网进行联络,其正常运行是牵引供电系统可靠供电的重要保障。为了保障高寒环境下牵引供电
在电磁推进系统中,电机需要在较短时间内推动质量很大的物体达到目标速度,这就对电机有着输出大推力的应用需求。在实际应用中为达到大功率输出要求,常选用多相电机类型,同时还能提高系统的可靠性与容错能力。永磁同步直线电机具备推力密度大、内部结构简单、效率高等突出优势,考虑到大推力输出对电源及功率器件性能的高要求和电机制造的实现难度,电磁推进系统多选择采用具有各相独立式特点的多相永磁同步直线电机。本文以电磁
地铁作为现代化城市出行的重要交通工具,保障其运行安全至关重要。利用运维技术对地铁列车进行评估,掌握其当前性能并用于维护决策是目前常用的手段。随着信息技术的发展,地铁运维向数字化、智能化转型成为大势所趋,传统单一的评估模式也需要向全面、系统、智能转变。数字孪生(Digital Twin,DT)作为虚实融合的最佳途径,为数字化转型提供了新的思路和方法,得到了国内外学者及企业的广泛关注。本文将数字孪生理
无线电能传输技术是一种能在无接触情况下通过电磁效应或能量交换作用实现能量传输的方式,具有广泛的发展和应用前景。在人体植入式设备、传感器网络等领域,在实现无线供电的同时还需要同步传输信息,来传输控制信息或反馈检测到的信号。随着无线电能传输技术研究的进一步深入,能量与信号的同步传输已成为扩展无线电能传输技术应用领域的关键技术之一,成为该领域的又一研究热点。本文结合磁浮列车间隙传感器在供电和信号传输方面
随着能源紧缺和环境污染的问题日趋严重,碳中和、碳达峰要求愈来愈逼近,运输装备轻量化愈加为工程技术界所重视。在轻量化材料中,镁合金以低密度、高比强度/比刚度、高阻尼、较强电磁屏蔽性能以及丰富的矿产资源而备受关注,但绝对强度低和耐磨性较差限制了其进一步广泛应用。石墨烯纳米片(Graphene nanoplatelets,GNPs)由于其极高的强度和良好的润滑性能有望同时提高镁基体的力学性能和减磨耐磨性