基于马尔可夫博弈的竞争云平台定价策略研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:b278651776
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,云计算技术日益成熟,其蕴含的巨大商业前景吸引了越来越多的企业进入云计算市场提供云服务,从而形成多云平台共存的竞争市场。在这个市场中,多个云平台互相竞争吸引用户,并通过收取费用来获得收益。在竞争环境下,云平台需要合理的定价策略来最大化收益。通过查阅大量文献,目前相关研究中没有考虑到激烈竞争环境下存在多个主动定价的云平台,且将其定价问题构建为重复博弈的情况。基于此,本文对竞争环境下云平台定价策略进行分析。在云计算市场中,多个云平台互相竞争,其定价策略互相影响,从而会周期性地不断更新最优定价,因此竞争云平台定价问题是一个复杂的马尔可夫博弈问题,本论文将基于两种多智能体强化学习算法—Nash Q-learning和Minimax-Q来解决此问题。本文主要研究工作如下:(1)首先根据云平台激烈竞争的特点,给出博弈的基本设定,包括云用户选择行为的推导、云平台成本的设定和云平台期望收益的计算方法。(2)在马尔可夫博弈的框架下,从直观上将多个云平台在每个周期的竞争定价过程看作一般和博弈,结合均衡策略,使用Nash Q-learning算法分析了竞争云平台的均衡定价策略。由于Nash Q-learning算法存在多个纳什均衡选择的问题,而相关文献并没有给出具体且有效的选择方法,因此,本文首先根据期望收益和Fictitious Play(FP)算法提出了四种纳什均衡选择方式,并根据这四种方式训练得到了四种不同的均衡定价策略。然后通过这四种均衡策略的相互对比,以及与云计算市场两种实际情景下的定价策略的比较,发现由FP算法得到的两种均衡策略具有相对更好的表现。(3)由于云平台激烈竞争的特性,因此在马尔可夫博弈的框架下,基于市场中只存在两个主动定价的云平台这一设定,从零和博弈的角度,使用MinimaxQ算法分析了竞争云平台的定价策略。首先使用Minimax-Q算法和联合Qlearning算法训练云平台得到了四种不同的定价策略。然后在云计算市场的三种实际情景下,将这四种策略与其它定价策略进行了对比分析,发现由MinimaxQ算法得到的两种Minimax策略在每种情景下都占有主导地位且表现稳定。最后将两种Minimax策略与由Nash Q-learning算法得到的四种均衡定价策略进行了对比,发现Minimax-Q算法在本文云平台激烈竞争的设定下具有更突出的表现。此外,实验发现由Minimax-Q算法和联合Q-learning算法得到的四种定价策略选择低价格的概率较低。实验结果证明了价格战的方式并不利于提高长期收益,而且充分验证了Minimax-Q算法更适合于研究本文激烈竞争设定下的云平台定价策略,为实际环境中竞争云平台定价策略的优化提供了指导。
其他文献
目的 了解上海市儿童腹泻流行特征、病原谱及致泻性大肠埃希菌(DEC)的耐药情况。方法 收集2015年4月至2018年3月在监测点医院就诊的初诊儿童腹泻病例,收集临床及流行病学资料
利用有限的排量实现高效的破岩效率并尽可能增大径向水平井眼的延伸能力是实施新型径向水平井技术的关键,射流钻头的性能是该关键技术要解决的首要问题。在多孔射流钻头的基
目的观察微信平台的延伸护理服务对机械瓣膜置换术后患者自护能力及生活质量的影响。方法选取2016年1月-2017年1月本院收治的82例机械瓣膜置换术后患者作为研究对象,按照入院
目的探讨鞣酸软膏涂擦配合红外照射治疗大小便失禁所导致的褥疮问题的临床疗效观察。方法选择大小便失禁所致Ⅰ、Ⅱ、Ⅲ度褥疮病例共62例随机分为2组,实验组给予鞣酸软膏涂擦
[目的]探讨体表心电图对急性下壁心肌梗死(AIMI)梗死相关动脉(infarct related artery,IRA)的诊断价值。[方法]2005年1月—2011年6月初次确诊为急性下壁心肌梗死的患者432例,包括
1855年黄河回归渤海,苏北沿岸陆源供沙基本断绝,连云港外航道海域逐渐成为冲刷性滨海环境。通过环境演化、地形地貌和波、流、沙等环境要素分析认为,1855年黄河供沙断绝后,在
【目的】以奉节县为研究对象,将生态敏感性评价和生物多样保护功能评价纳入评价指标体系,评价山区城镇建设用地适宜性。【方法】共选取包含自然、经济和生态3方面的13个弹性
<正>陕西师范大学(长安校区)幼儿园坐落在风景秀丽、书香浓郁、文化底蕴深厚的陝西师范大学校内,是陕西省示范幼儿园。幼儿园共有教职工121人,专任教师73人,其中具有硕士学历