基于多臂赌博机在线学习的无线缓存策略研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:bluesky8013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能终端的计算和存储能力不断提高,大量新业务不断涌现,造成了移动数据流量迅速增长。其中,视频服务是数据流量增长的主要来源,这使现有的无线网络面临巨大的挑战。为了满足不断增长的流量需求,研究人员根据热门内容在短时间内被反复请求的特点,提出了一种新型的边缘网络架构:即将热点内容提前存储在靠近用户的基站端。当有用户需要请求内容时,如果基站已缓存该内容,那么基站可以直接为用户提供服务。这种新颖架构不仅能缓解现有核心网络的压力,而且也会减少用户获取内容的传输时延。近年来,缓存策略的设计已成为研究热点之一。本文在未知内容流行度的前提下,研究不同场景下的微基站缓存策略设计,以多臂赌博机(Multi-armed Bandit,MAB)理论为数学工具,开展了以下研究工作:首先,研究了单目标热点内容的缓存策略设计。在未知内容流行度的条件下,我们将微基站的缓存问题构建为组合式多臂赌博机模型(Combinatorial-MAB,CMAB):将微基站比作决策者(赌徒),热点内容比作是摇臂,热点内容的需求量比作摇臂的奖赏,赌徒拉臂的过程比作是微基站缓存热点内容的行为。根据贪婪策略和上置信策略(Upper Confidence Bound,UCB)设计了算法,并对算法进行了分析,验证了算法损失是对数性的。其次,研究了多目标热点内容的缓存策略设计。在未知内容流行度的条件上,引入内容的付费特性,提出了多目标内容缓存问题。我们将该多目标缓存问题构建为多目标多臂赌博机模型(Multi-Objective-MAB,MO-MAB),提出了基于线性加权原则和帕累托原则的两种多目标在线学习算法。仿真结果表明,所提的两种多目标缓存在线学习算法的性能比现有算法更具优势,并分别分析了算法的性能损失,证明了所提算法的遗憾函数是对数性的。最后,研究了组块化多目标热点内容集的缓存策略设计。在上述多目标缓存的条件上,考虑了内容集合的多目标缓存问题,构建了组合式多目标多臂赌博机模型(Combinatorial MO-MAB,CMO-MAB)。我们提出了基于超级帕累托原则的多目标主动缓存的在线学习算法,证明了算法损失遗憾是对数性的。仿真结果表明,所提算法能获得较高的累计收益,相比其它算法,更适应复杂的多目标缓存环境。
其他文献
佛山市1 640名3~6岁儿童采用氟化泡沫护齿,护齿前后龋患率有显著性差异,(u=20.5,P<0.01).护齿后龋齿新发病率实验组明显低于对照组,(u=3.66,P<0.01).实验组龋均护齿前后有显著性
陕西南部具有独特的地方特色和气候条件,其马铃薯栽培以马铃薯玉米间套为主。生产中往往存在农户对新技术了解不到位、技术普及范围小等问题,技术上存在种薯质量差、药剂拌种
复杂亲缘关系鉴定是指由于父或(和)母已亡,或因为其他原因不能参加检验,为了民事或刑事案件中的个体识别等而进行的特殊亲缘关系鉴定。这种亲缘关系鉴定案件由于重要被鉴定人
教育是心灵与心灵的融合,灵魂与灵魂的对话,智慧与智慧的碰撞,生命与生命的互动。因此,教育需要无痕。我们提倡无痕的教育,就是要在教育过程中把教育意图隐蔽起来,以一种自然和谐的
作为企业带头人,他带领企业在不断发展的同时,主动承担社会责任;作为基层党支部书记,他团结带领群众脱贫致富,走上了富裕幸福之路;作为一名全国人大代表,他忠实履行职责,尽心