基于强化学习的认知无线电网络频谱分配方法研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户：qncy1230s

【摘要】

：

随着移动互联网的快速发展和智能终端技术的不断更新,无线移动用户的数量在过去几年中不断增加。预计这种趋势将在未来几年内会一直持续。考虑到用户数量的蓬勃发展,无线网络

【作者】

：

张静静

【出处】

：

曲阜师范大学

【发表日期】

：

2004年期

【关键词】

：

认知无线电网络 Q学习动态频谱接入奖励函数博弈论

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着移动互联网的快速发展和智能终端技术的不断更新,无线移动用户的数量在过去几年中不断增加。预计这种趋势将在未来几年内会一直持续。考虑到用户数量的蓬勃发展,无线网络的移动流量也将不断增加。为了满足未来移动通信的需求,应不断的提高网络容量。增加容量的有效方法是为无线通信系统分配更多的频谱资源。然而,随着频谱行业的迅速发展,频带已经变得人满为患,但用户对频谱资源的需求却越来越迫切,从而导致频谱变成了一种稀缺资源,因此为网络中的每个用户分配足够的频谱资源是不现实的。另一方面,由于传统的频谱管理策略仍存在一些不足,例如,频带只允许获权的主用户使用,未获权的辅助用户不允许使用该频带,这类问题导致已分配的频谱资源并未得到充分的利用。在这样的背景下,为了缓解这一矛盾,提高频谱的利用率是刻不容缓的,认知无线电技术便应用而生。认知无线电技术以认知能力为核心,并且可以从环境中学习并适应该环境,这为缓解频谱短缺和频谱利用率不足的问题提供了有效的解决方案。在认知无线电网络中,具有自主学习能力的强化学习算法能够更好的解决频谱分配问题,强化学习算法可以为有限马尔可夫决策过程(MDP)确定最佳策略,该策略用于对不确定性下的动态频谱访问问题进行决策建模。而强化学习中的Q学习是一种有效的决策模型,因此,基于Q学习的动态频谱接入技术具有非常重要的研究价值。基于此背景,本文的具体研究内容如下:(1)本文提出了一种改进的基于Q学习的认知无线电网络频谱资源分配算法。从Q学习的角度构建数学模型,将认知无线电网络中的多个辅助用户作为多个学习者,而无需事先了解相互的干扰。具体为重新设计了奖励函数功能,其基本原理是在学习过程中对连续正确的行为给予强有力的奖励,而对连续错误行为给予强有力的惩罚。改进的奖励函数可以更好地激发算法的学习潜力,同时该算法更接近实际情况且更加智能和用户友好。此外,平均意见值(Mean Opinion Score,MOS)已成为衡量终端用户主观体验质量(Qo E)的广泛使用指标。因此,开发一种基于MOS的分布式动态频谱访问(DSA)方案,在满足主用户(PU)干扰约束且总MOS值最大的条件下,可以实现主用户和辅助用户的共存。仿真实验结果表明,与原始的Q学习算法相比,在MOS值和平均比特率方面,绝大部分情况下所提出的算法优于原始的Q学习算法,保证了用户的良好体验质量。(2)本文设计了一种基于博弈的Pareto-Q学习算法(GPQL),从联合博弈的Q学习角度出发,构建数学模型,将认知无线电网络中的诸多辅助用户视为学习者,只需利用其历史状态,无需了解各个用户之间相互干扰的先验知识。通过Q学习,在满足主用户可容忍干扰限制条件下,可以允许主用户和辅助用户以公平的方式共享频谱。由于原始的Q学习算法效率较低,无法获得更好的频谱资源分配。考虑在进行频谱资源分配时能够采用一种更优的方式,本文将博弈论与Q学习算法相结合,在研究多个学习者的行为协作方式时,从合作联盟收益的结构分配角度出发,提出一种改进的Pareto-Q学习算法,该算法以多个学习者的合作联盟理论和马尔可夫博弈理论为基础,在强化学习的基础上,将局部联合最优行为目标视为全局目标,利用每个学习者都能接受的共同利益分配,通过迭代学习的方式将全局目标转化为局部Pareto联合最优行为目标。同时还引入了sigmod函数,使算法具有更好的决策执行能力且能够将Q表中的值控制在有限范围内,使数据在迭代过程中不易发散。仿真实验结果表明,GPQL方法在系统吞吐量和系统碰撞率方面均优于原始的Q学习,因此,这证明基于博弈的Q学习是可行且有效的。

其他文献

控制河段船舶通行多目标优化调度模型研究

长江上游控制河段通航条件差,过往船舶需根据通行信号台的指挥信号按序通过。确保控制河段船舶通行安全,提高控制河段通行效率是通行指挥的首要任务。充分应用长江“数字航道

学位

船舶调度多目标优化控制河段蚁群算法智能航道

基于探墙雷达的图像超分辨率重建算法研究

雷达成像方法是一种穿透性好,稳定性高的探测成像技术,在刑侦探测、房屋检修等众多军用和民用领域具有广泛的应用。但是,目前雷达成像系统依旧存在以下局限性:没有充分考虑障

学位

探墙雷达超分辨率重建深度学习RadarNetFPGA

复杂云背景下红外弱小目标检测算法研究

红外成像具有全天候工作、受天气影响较小等优势,因此在遥感领域、安防领域、航空航天领域有着较广泛领域。而在远距离探测平台上,如遥感卫星等,由于探测距离远,目标在成像平

学位

红外图像弱小目标时域方差时域廓线

基于全局与非全局块匹配的去噪算法

图像作为人类获取视觉信息的一种重要媒介,在医疗、军事等领域都扮演着至关重要的角色.然而在图像的采集、传输等过程中,由于设备及人为等各种因素的影响,图像经常受到噪声的

学位

图像去噪低秩近似高斯混合模型非局部自相似性预处理

基于Gabor滤波深度网络的高光谱图像分类方法研究

高光谱图像包含了丰富的光谱信息,在遥感对地观测系统中具有重要的地位,并越来越广泛的应用于地物勘探、农业遥感、海洋遥感、环境监测等领域。在高光谱图像分类的研究中,已

学位

高光谱图像分类稀疏自编码网络深度置信网络深度网络Gabor滤波虚拟样本

基于FPGA的EtherCAT主站实现与高性能运动控制

随着以太网类型的传输技术在工业控制等相关领域的成熟与发展,各种类型的现场总线技术已被广泛使用,其中最典型的是Ether CAT型总线,它依靠高传输速度,传输精度高,适用性广,

学位

EtherCAT协议栈FPGA主站Verilog

季鏻盐自组装结构设计及其生物传感器研究

季鳞盐离子液体作为一种新型的自组装功能材料,目前广泛应用于有机化学、电化学、功能材料、生物医药等重多领域。现阶段,国内外对于季鳞盐的自组装结构设计及构性关系未进行

学位

季鏻盐结构设计自组装电致化学发光生物传感器

基于97单元MEMS变形镜的自适应光学系统SPGD算法实现

由于大气的湍流影响,光在大气传播过程中会出现不同程度的波前畸变,波前畸变会给天文观测带来极大的阻碍,使得天文目标的高清晰成像变得异常困难。自适应光学（Adaptive Optics

学位

自适应光学系统实验平台SPGD控制算法97单元MEMS变形镜

郑州市社会保险经办机构服务能力提升研究

社会保险服务是公共服务的一部分,也是我国当前“放管服”改革的重要内容之一。各级社会保险经办机构是政府提供社会保险服务的重要载体,也是我国社会保险政策的执行机构和管

学位

放管服改革社会保险服务群众满意度

南二三区高台子油层注采优化调整技术研究

我国大多数油田采用注水方式开发,目前经过几十年的开发,大多数水驱油田已经进入水驱开发后期,也就是高含水或者特高含水期。大庆油田南二三区高台子油层整体为三类油层,目前

学位

分层注水精细注水高含水期注采结构优化井震联合

基于强化学习的认知无线电网络频谱分配方法研究

其他学术论文