多目标优化的TCP拥塞控制改进算法设计

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lu_bo_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机网络和移动通信技术飞速发展,网络服务越来越丰富。伴随而来的是互联网数据的急剧增长,数据传输网络拥塞变得越来越严重。传输控制协议(Transmission Control Protocol,TCP)的关键——拥塞控制算法是解决网络拥塞的重要手段,在互联网数据通信领域被广泛应用与研究,有效提升了端到端数据传输性能和增加用户的体验。现有拥塞控制算法可划分为基于规则的拥塞控制算法和基于学习的无规则拥塞控制算法。其中,规则表示固定的根据网络反馈信号调整发送窗口的方式。基于规则的典型算法Cubic基于特定的拥塞信号采用预先定义的规则调整发送端的发送窗口,无法利用动态网络资源实现数据传输的高吞吐量和低延时。基于学习的算法则主要利用强化学习的手段学习得到合适的拥塞控制算法调整发送端的发送窗口,并在此过程中不断地实现代理和环境之间的状态、动作和奖励等数据的交互,以最大化累积奖励。但是,在优化多个目标时,其多目标奖励函数通常是难以设计的。针对上述策略在实现多目标传输性能的不足,本文提出了持续提升TCP拥塞控制算法多目标传输性能的方案。首先,考虑到谷歌公司2017年提出的基于规则的拥塞控制算法BBR的高吞吐量和低延时性能,其在数据通信网络被广泛应用。但是,BBR算法控制的数据流(端到端的TCP连接)与异构数据流(由不同的拥塞控制算法控制)共享链路时,BBR数据流会强势地填充链路,触发网络中默认队列管理机制Drop Tail,产生大量丢包。出现丢包时,其他数据流的发送窗口将减半,BBR数据流对丢包不响应,导致其数据流不公平地占用过多带宽。针对上述不公平性问题,本文提出了一种用于路由调度的公平队列管理算法CKCD(Choose-Keep and Controlled-Delay)。该算法通过主动地丢弃两种数据流的数据包来实现异构数据流间公平性的同时保证高吞吐量和低延时,其中两种数据流为:1)由于对丢包无响应而产生过多积压的数据流;2)排队延时较大的数据流。实验结果表明,相比于与BBR共同运作的默认机制Drop Tail,CKCD提升公平性高达62%,同时减少平均传输延时高达92%,保证96%链路利用率(即保证高吞吐量)。其次,考虑到强化学习被广泛应用于TCP拥塞控制,而传统的强化学习算法在优化多个目标时,其多目标奖励函数一般难以设计。针对上述多目标优化存在的挑战,本文设计了一种用于多目标优化的约束强化学习算法(Constrained Reinforcement Learning,CRL)应用于拥塞控制策略。该算法首先采用约束马尔科夫决策过程思想将多目标优化问题表述为有约束优化问题,并利用拉格朗日松弛法将有约束优化问题转化为单目标优化问题,最后采用约束强化学习框架训练得到优化多目标性能的拥塞控制策略。大量实验证明,与经典算法PCC相比,用于TCP拥塞控制的CRL算法不仅避免目标函数设计困难的问题,还提升21.7%公平性和5.4%吞吐量,以及降低27.4%传输延时。本文的创新点如下:(1)分析BBR控制的数据流不公平地占用带宽的原因,设计了公平的队列管理机制CKCD来解决异构数据流间公平性问题,同时提升网络吞吐量以及降低传输延时;(2)分析传统的强化学习算法优化多个目标存在的挑战,提出了约束强化学习算法CRL来实现多目标优化;(3)为了实现基于CRL的拥塞控制策略的思想,设计了用于网络拥塞控制的约束强化学习框架来优化多个目标传输性能。
其他文献
随着高考制度的深化改革,高考英语试卷的难度显著提升,其表现主要在于语篇材料深度和广度的显著提高。阅读长期以来都被认为是英语教学的核心部分,教师们投入了大量的时间与精力对学生进行阅读训练,而许多学生走出考场仍感到发挥不佳。除去语篇自身难易程度的客观因素,不少研究也发现这与一些主观因素有关。其中情感因素就受到了语言学家的重视。Spielberger和Horwitz等人一致认为焦虑是影响外语学习最关键的
软件定义网络(Software Defined Network,SDN)是一种新型的网络架构,分离了传统网络中的控制和转发功能,推动了互联网技术的进步,同时也带来了新的安全问题。分布式拒绝服务(Distributed Denial of Service,DDo S)攻击一直是互联网的主要威胁,在SDN网络中更会导致控制器资源的耗尽,影响整个网络的正常运行。为了解决SDN网络中的DDo S攻击问题,
为了应对日益严峻的全球能源危机和环境保护问题,同时确保人类生存和社会经济发展,探索开发新能源体系是最好的应对措施。其中,Li-O2电池作为新一代储能设备展现巨大潜力和广阔应用前景,具有极高的理论比能(11430 Wh kg-1),远远超过了商用锂离子电池的250 Wh kg-1,甚至可与燃料油体系的比能相媲美(13000 Wh kg-1)。迄今为止,对Li-O2电池的研究已经取得长足进步,但是,实
随着国内金融市场防范风险的力度进一步加大,国内部分企业与政府在国内发行债券时,或因为政策又或因为最终投资者等因素受到诸多限制与不便。而近年来海外利率普遍走低,虽然有部分国家(比如美国)基准利率上调了几次,但总体来看,海外利率水平相较于国内仍处于低位。因此,许多在国内通过债券融资渠道受限的企业或政府纷纷将目光投向了海外,瞄准了美元债这一市场。近几年来,美元债市场越来越火爆,一级市场发行规模总体呈现快
欧米茄专利公司诉坎普公司案由权威法律搜索工具Westlaw International收录,判决于2019年4月8日。该案例主要关于欧米茄专利公司对坎普公司发起的专利侵权诉讼,提出坎普公司违反了四条主要权利要求和对专利产品的直接或间接侵权。该案例主要分为四部分,即背景、详述、费用和附件。在法律案例---《欧米茄专利公司诉坎普公司案》翻译实践的基础上,本翻译报告以翻译实践中的长句翻译为例,探讨了法律
公路货车非法超限超载运输危害很大,对公路、桥涵及交通运输安全等造成严重威胁。近年来,我国各地投入了大量人员、经费、物资,用于治理公路货运超限超载。然而,非法超限超载年年治,公路桥梁损坏年年补,超限超载运输屡禁不止、屡整不改、屡治不绝,各地各部门在实际治理过程中陷入了措施不得力、方法不管用、效果不清楚的境地。本文使用了文献研究、实地调研、问卷调查、访谈法等方法,运用公共管理学的相关理论,从公路货运超
铅酸蓄电池产业是国民经济的重要组成部分,本文研究的A公司是铅酸蓄电池隔膜的龙头企业,其产品主要应用于汽车用铅酸蓄电池,占有全球50%以上的市场份额,在中国市场的铅酸蓄电池隔膜市场份额曾高达80%。随着汽车工业的快速发展,汽车行业的竞争日趋激烈,加上锂电池对传统铅酸蓄电池行业的冲击,作为铅酸蓄电池配套产业的A公司面临市场份额及销售利润双双下降的窘境。随着中国经济的增长,中国市场目前在A公司全球布局中
在教化思想深耕、文风兴盛的徽文化区乡土社会中,文教建筑遍及乡野、种类繁多,其在数量和影响力上均具有研究价值;且文教建筑作为是乡村文化精神的载体,其建筑空间艺术背后所蕴含的历史人文精神和优秀传统文化至关重要,对文教建筑的保护和活化利用具有启示意义。由于战乱破坏和保护不力,现存的文教建筑仅约一成,且乡土社会中仍散落着大量文教建筑遗产亟待发掘和保护,因此选择本课题,力图探寻和传承徽文化区文教建筑空间的艺
学位
沿海低地主要包括河口三角洲和沿海平原,这些地区通常人口稠密、经济发达。由于全球面临日益加剧的气候变化和海平面上升,沿海低地面临的风险也不断增大。长江三角洲拥有的沿海低地面积在全球所有三角洲中居于第四位,人口数量居于第二位。长江三角洲地区(以下简称长三角)的沿海低地是全球气候变化与海平面上升影响的关键区和敏感区,21世纪,在气候和非气候因素(人口与资产增长、城市化、土地利用变化等)的驱动下,长三角沿