论文部分内容阅读
随着智能终端的计算和存储能力不断提高,大量新业务不断涌现,造成了移动数据流量迅速增长。其中,视频服务是数据流量增长的主要来源,这使现有的无线网络面临巨大的挑战。为了满足不断增长的流量需求,研究人员根据热门内容在短时间内被反复请求的特点,提出了一种新型的边缘网络架构:即将热点内容提前存储在靠近用户的基站端。当有用户需要请求内容时,如果基站已缓存该内容,那么基站可以直接为用户提供服务。这种新颖架构不仅能缓解现有核心网络的压力,而且也会减少用户获取内容的传输时延。近年来,缓存策略的设计已成为研究热点之一。本文在未知内容流行度的前提下,研究不同场景下的微基站缓存策略设计,以多臂赌博机(Multi-armed Bandit,MAB)理论为数学工具,开展了以下研究工作:首先,研究了单目标热点内容的缓存策略设计。在未知内容流行度的条件下,我们将微基站的缓存问题构建为组合式多臂赌博机模型(Combinatorial-MAB,CMAB):将微基站比作决策者(赌徒),热点内容比作是摇臂,热点内容的需求量比作摇臂的奖赏,赌徒拉臂的过程比作是微基站缓存热点内容的行为。根据贪婪策略和上置信策略(Upper Confidence Bound,UCB)设计了算法,并对算法进行了分析,验证了算法损失是对数性的。其次,研究了多目标热点内容的缓存策略设计。在未知内容流行度的条件上,引入内容的付费特性,提出了多目标内容缓存问题。我们将该多目标缓存问题构建为多目标多臂赌博机模型(Multi-Objective-MAB,MO-MAB),提出了基于线性加权原则和帕累托原则的两种多目标在线学习算法。仿真结果表明,所提的两种多目标缓存在线学习算法的性能比现有算法更具优势,并分别分析了算法的性能损失,证明了所提算法的遗憾函数是对数性的。最后,研究了组块化多目标热点内容集的缓存策略设计。在上述多目标缓存的条件上,考虑了内容集合的多目标缓存问题,构建了组合式多目标多臂赌博机模型(Combinatorial MO-MAB,CMO-MAB)。我们提出了基于超级帕累托原则的多目标主动缓存的在线学习算法,证明了算法损失遗憾是对数性的。仿真结果表明,所提算法能获得较高的累计收益,相比其它算法,更适应复杂的多目标缓存环境。