拥塞控制是实现高性能数据中心网络的关键技术之一,影响吞吐量、延迟、丢包率等重要网络性能指标。过去20年间,随着数据中心规模不断扩大,上层应用对网络性能的要求不断提高,基于无损底层网络的远程直接内存访问(remote direct memory a...拥塞控制是实现高性能数据中心网络的关键技术之一,影响吞吐量、延迟、丢包率等重要网络性能指标。过去20年间,随着数据中心规模不断扩大,上层应用对网络性能的要求不断提高,基于无损底层网络的远程直接内存访问(remote direct memory access,RDMA)技术在数据中心的部署受到了业内广泛关注。然而,基于优先级的流控(priority-based flow control,PFC)机制在维护无损网络的同时会引入头阻塞等问题,导致网络性能下降甚至网络瘫痪。作为实现无损网络的关键辅助手段,如何设计实用的RDMA拥塞控制机制成为了热点问题。通过将拥塞控制过程划分为拥塞感知与拥塞调整,全面综述了该领域的研究成果:首先从显式反馈与延迟的角度详细阐述并总结了不同的拥塞感知代表算法;其次从速率和窗口的维度对拥塞调整代表算法进行了详细介绍并对其优缺点进行了总结;而后补充了部分算法的优化工作以及基于强化学习方法的拥塞控制算法;最后总结并讨论了该领域存在的挑战。展开更多