M2M通信中基于机器学习的无线资源管理的研究

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:huaihuaitaizi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物联网(Internet of Things,IoT)的最终目标是实现人或物随时、随地、使用任何通信方式与任何人或物进行信息交互,IoT的高速发展将大大方便人们的生活。其中,机器对机器(machine to machine,M2M)通信指的是在无需人的干预的情况下实现设备之间的自主通信,是IoT的重要组成部分。蜂窝网络以其广覆盖、高可靠、支持高速移动等优点成为M2M通信的理想载体。然而,蜂窝网络中现有的资源分配算法主要针对传统的人对人(Human to Human,H2H)通信,而M2M设备具有业务种类繁多、省电要求高、数量大等独有的特点,已有的无线资源分配算法并不完全适用。本文引入了强化学习算法,并在两种场景下实现了对有限资源的合理分配。主要研究内容和创新点如下:1.针对M2M通信的多业务特性,使用三种不同的用户体验质量(Quality of Experience,QoE)函数区分设备的速率需求,并以提高QoE与减小功率消耗为目标进行频谱和功率分配。为了减小基站对海量设备进行集中式调度的负担,针对混合非线性规划问题,提出一种基于强化学习的分布式算法,将M2M设备建模成具有强化学习能力的智能体,使设备可以自主选择频谱和功率等级,大大减小了算法的复杂度。2.为了协调M2M设备对上行频谱的竞争,引入了基于博弈论的多智能体强化学习算法。同时,为了在无需信息交互的情况下实现智能体之间的协作,引入了预测方法,使智能体可以以自身行为为参照来预测其他智能体的策略。仿真结果表明,算法在QoE、省电和计算复杂度方面达到了较好的性能。3.为了减小M2M设备的能量消耗,提高它们的网络生存时间,将中继技术和能量收集技术结合起来应用在M2M通信网络中,主要关注中继选择和M2M终端与中继的功率分配,以及能量收集时间分割系数的划分。将最优化问题分解为三个子问题。首先依据信道条件进行中继选择,然后求解最优化问题得到源节点的发送功率,最后,为了实现带有可充电装置的中继的在无限时间内的速率最大化,利用强化学习延迟回报的特点实现时间分割系数和发送功率的选择,并引入值函数近似法处理中继所面临的连续状态。仿真分析表明,算法有很好的收敛性,并在中断率和平均速率上达到了较好的性能。
其他文献
长期以来人们较为忽视海关和地理的关系,本文首次尝试运用地理学的有关理论和方法,提出和分析了关境、关区、关址以及海关与环境、海关组织的交流与传播、海关区域分异与整合
非监禁刑作为一类刑事制裁方法,与监禁刑相比,在发挥刑罚的教育和矫正功能、体现刑罚人道性和谦抑性思想以及实现刑罚适用的经济性和效益性等方面具有无可比拟的优越性。我国
<正>本文结合山西省县域村镇体系规划的编制情况,试就县域村镇体系规划的相关问题如本规划在规划体系中处于什么地位,与相关规划是什么关系,要解决什么问题,包括哪些内容等等
新的治安形势下,违法犯罪正在向暴力化、集团化、现代化、智能化发展,对人民警察的人身权构成了严重威胁。警察伤亡率的逐年升高,暴露了警察在警务活动中自我保护能力的薄弱。强
目的比较在脑血管介入治疗后采用手工压迫止血与动脉压迫止血器两种止血方式的临床效果。方法选取脑血管造影及介入治疗患者共76例,分为对照组及观察组。对照组采用手工压迫
纳税筹划是指纳税人以税收政策为依据,在对企业发展战略和经营情况全面分析的基础上,通过对企业的生产、经营、投资、理财等活动的事先策划和安排,尽可能节约税款,以获得最大
<正>重庆中央公园选址于重庆市两江新区的国际中心区的核心区,西距重庆国际会展中心约3km,东距重庆江北国际机场约5km,南距江北嘴CBD中央商务区约15km,区位条件优越。公园南
满族在2001年第五次全国人口普查时有1068.23万人,论人口,在全国少数民族中仅次于壮族名列第二位。满族主要分布在东北三省和河北、内蒙古、北京等地,以辽宁最多。全国共有辽宁的
由于基于IRC协议的僵尸网络存在单点失效的天然缺陷,越来越多的僵尸网络转而使用非集中式命令与控制信道。基于P2P协议的僵尸网络就是其中最重要的一种。P2P僵尸网络经过10多
介绍了核级气动执行机构抗震分析的方法,论述了应力评定准则,验证了气动执行机构抗震性能的合理性。此分析法可提高设备地震鉴定试验的通过率,亦可作为气动执行机构系列产品