沙戈荒区域丰富的风光热资源有利于支撑高能耗数据中心集群快速发展,但会使其面临算力负载强时变性、风光出力间歇性及恶劣天气离网运行可靠性的多重挑战。为此,该文提出一种考虑任务负载需求响应及源荷不确定性的数据中心集群微网电-...沙戈荒区域丰富的风光热资源有利于支撑高能耗数据中心集群快速发展,但会使其面临算力负载强时变性、风光出力间歇性及恶劣天气离网运行可靠性的多重挑战。为此,该文提出一种考虑任务负载需求响应及源荷不确定性的数据中心集群微网电-热设备容量协同优化配置方法。首先,根据计算任务对时延的敏感性,精细化建模可推迟可中断、可推迟不可中断及不可推迟3类任务负载的时间约束,在此基础上综合源荷不确定性建立数据中心集群微网“并网-离网”2阶段分布鲁棒优化模型,采用列与约束生成(column and constraint generation,C&CG)算法求解。以青海某实际数据中心为案例的分析结果表明:所提出的方法可使微网容量配置成本下降约25.8%,弃风率下降约56%,并大幅提高数据中心集群微网离网运行可靠性。该文研究为沙戈荒区域绿色低碳数据中心建设提供了理论支撑。展开更多
拥塞控制是实现高性能数据中心网络的关键技术之一,影响吞吐量、延迟、丢包率等重要网络性能指标。过去20年间,随着数据中心规模不断扩大,上层应用对网络性能的要求不断提高,基于无损底层网络的远程直接内存访问(remote direct memory a...拥塞控制是实现高性能数据中心网络的关键技术之一,影响吞吐量、延迟、丢包率等重要网络性能指标。过去20年间,随着数据中心规模不断扩大,上层应用对网络性能的要求不断提高,基于无损底层网络的远程直接内存访问(remote direct memory access,RDMA)技术在数据中心的部署受到了业内广泛关注。然而,基于优先级的流控(priority-based flow control,PFC)机制在维护无损网络的同时会引入头阻塞等问题,导致网络性能下降甚至网络瘫痪。作为实现无损网络的关键辅助手段,如何设计实用的RDMA拥塞控制机制成为了热点问题。通过将拥塞控制过程划分为拥塞感知与拥塞调整,全面综述了该领域的研究成果:首先从显式反馈与延迟的角度详细阐述并总结了不同的拥塞感知代表算法;其次从速率和窗口的维度对拥塞调整代表算法进行了详细介绍并对其优缺点进行了总结;而后补充了部分算法的优化工作以及基于强化学习方法的拥塞控制算法;最后总结并讨论了该领域存在的挑战。展开更多
无损以太网对于数据中心网络有着很强的吸引力,如今为了实现无损这一目的,诞生了很多新的拥塞控制协议如Data Center TCP(DCTCP)、Quantized Congestion Notification(QCN)、Data Center Quantized Congestion Notification(DCQCN)等。...无损以太网对于数据中心网络有着很强的吸引力,如今为了实现无损这一目的,诞生了很多新的拥塞控制协议如Data Center TCP(DCTCP)、Quantized Congestion Notification(QCN)、Data Center Quantized Congestion Notification(DCQCN)等。对DCTCP、DCQCN等拥塞控制算法进行仿真实验,分析不同的拥塞控制在数据中心网络模型中应对大量突发流的情况,并分析其中存在的拥塞扩散、发送源阻塞、死锁等问题。针对这些问题进行改进,提出融合控制拥塞通知(Fusion Control Congestion Notification,FCCN),以改善拥塞扩散和死锁问题,减少了拥塞控制的吞吐量损失。多次仿真结果表明提出的FCCN方法在不丢包的情况下应对的突发流达到DCTCP的1.5倍,同时突发流对于整个网络吞吐量的下降减少了20%,延迟减少了25%。展开更多
文摘沙戈荒区域丰富的风光热资源有利于支撑高能耗数据中心集群快速发展,但会使其面临算力负载强时变性、风光出力间歇性及恶劣天气离网运行可靠性的多重挑战。为此,该文提出一种考虑任务负载需求响应及源荷不确定性的数据中心集群微网电-热设备容量协同优化配置方法。首先,根据计算任务对时延的敏感性,精细化建模可推迟可中断、可推迟不可中断及不可推迟3类任务负载的时间约束,在此基础上综合源荷不确定性建立数据中心集群微网“并网-离网”2阶段分布鲁棒优化模型,采用列与约束生成(column and constraint generation,C&CG)算法求解。以青海某实际数据中心为案例的分析结果表明:所提出的方法可使微网容量配置成本下降约25.8%,弃风率下降约56%,并大幅提高数据中心集群微网离网运行可靠性。该文研究为沙戈荒区域绿色低碳数据中心建设提供了理论支撑。
文摘无损以太网对于数据中心网络有着很强的吸引力,如今为了实现无损这一目的,诞生了很多新的拥塞控制协议如Data Center TCP(DCTCP)、Quantized Congestion Notification(QCN)、Data Center Quantized Congestion Notification(DCQCN)等。对DCTCP、DCQCN等拥塞控制算法进行仿真实验,分析不同的拥塞控制在数据中心网络模型中应对大量突发流的情况,并分析其中存在的拥塞扩散、发送源阻塞、死锁等问题。针对这些问题进行改进,提出融合控制拥塞通知(Fusion Control Congestion Notification,FCCN),以改善拥塞扩散和死锁问题,减少了拥塞控制的吞吐量损失。多次仿真结果表明提出的FCCN方法在不丢包的情况下应对的突发流达到DCTCP的1.5倍,同时突发流对于整个网络吞吐量的下降减少了20%,延迟减少了25%。