期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
超算集群无损RoCEv2网络性能评测
1
作者 龙汀汀 付振新 +3 位作者 李若淼 龚翔宇 吴涛 樊春 《通信学报》 CSCD 北大核心 2024年第S2期113-121,共9页
为了评估无损RoCEv2网络技术在高性能计算(HPC)领域的实际表现,以无损RoCEv2、TCP/IP和InfiniBand这3种网络为测试对象,搭建HPC集群,使用主流的HPC Benchmark和科学计算应用对上述3种网络进行对比测试,获取各网络的基本性能数据以及在... 为了评估无损RoCEv2网络技术在高性能计算(HPC)领域的实际表现,以无损RoCEv2、TCP/IP和InfiniBand这3种网络为测试对象,搭建HPC集群,使用主流的HPC Benchmark和科学计算应用对上述3种网络进行对比测试,获取各网络的基本性能数据以及在科学计算应用场景下的实际表现,还测试了基于RoCEv2的240节点集群的HPL效率。实验结果表明,在超算集群中,无损RoCEv2与InfiniBand有基本相当的性能,且都显著优于TCP网络。随着集群节点数量的增加,RoCEv2网络具有较好的线性可扩展性。无损RoCEv2网络相对于InfiniBand,在保持成本优势的同时具有大致相当的性能。 展开更多
关键词 高性能计算 rocev2 INFINIBAND 无损网络
在线阅读 下载PDF
以太网RDMA网卡综述
2
作者 黄曼蒂 李韬 +3 位作者 杨惠 李成龙 张毓涛 孙志刚 《计算机研究与发展》 北大核心 2025年第5期1262-1289,共28页
目前数据中心规模迅速扩大和网络带宽大幅度提升,传统软件网络协议栈的处理器开销较大,并且难以满足众多数据中心应用程序在吞吐、延迟等方面的需求.远程直接内存访问(remote direct memory access,RDMA)技术采用零拷贝、内核旁路和处... 目前数据中心规模迅速扩大和网络带宽大幅度提升,传统软件网络协议栈的处理器开销较大,并且难以满足众多数据中心应用程序在吞吐、延迟等方面的需求.远程直接内存访问(remote direct memory access,RDMA)技术采用零拷贝、内核旁路和处理器功能卸载等思想,能够高带宽、低延迟地读写远端主机内存数据.兼容以太网的RDMA技术正在数据中心领域展开应用,以太网RDMA网卡作为主要功能承载设备,对其部署发挥重要作用.综述从架构、优化和实现评估3个方面进行分析:1)对以太网RDMA网卡的通用架构进行了总结,并对其关键功能部件进行了介绍;2)重点阐述了存储资源、可靠传输和应用相关3方面的优化技术,包括面向网卡缓存资源的连接可扩展性和面向主机内存资源的注册访问优化,面向有损以太网实现可靠传输的拥塞控制、流量控制和重传机制优化,面向分布式存储中不同存储类型、数据库系统、云存储系统以及面向数据中心应用的多租户性能隔离、安全性、可编程性等方面的优化工作;3)调研了不同实现方式、评估方式.最后,给出总结和展望. 展开更多
关键词 远程直接内存访问 以太网RDMA网卡 rocev2 网卡架构 网卡优化 数据中心网络
在线阅读 下载PDF
面向异构算力互联的智算网络关键技术研究
3
作者 苏昱臻 王子潇 +3 位作者 钟驰量 寇晓淮 刘圆 陈映 《电信科学》 北大核心 2025年第8期51-64,共14页
算力供给的代际异构性与供应链安全需求,促使异构算力成为AI基础设施的新趋势。然而,在异构混合训练场景中,基于融合以太网的RDMA版本2(RDMA over converged Ethernet version 2,RoCEv2)方案存在负载均衡与拥塞控制缺陷,在模型训练的并... 算力供给的代际异构性与供应链安全需求,促使异构算力成为AI基础设施的新趋势。然而,在异构混合训练场景中,基于融合以太网的RDMA版本2(RDMA over converged Ethernet version 2,RoCEv2)方案存在负载均衡与拥塞控制缺陷,在模型训练的并行通信中性能欠佳;而现有高性能同构智算网络方案因设备异构与集合通信库(collective communication library,CCL)闭源难以部署。为此,提出了面向异构算力场景的高性能智算网络解决方案——智能控制以太网(intelligent control Ethernet,ICE)。该方案基于RoCEv2协议体系,在避免对设备、CCL进行深度定制的前提下,将异构通信库信息采集、集中控制器与端侧自主控制相结合,实现全局最优路径规划及全局主动拥塞控制,显著提升异构并行通信性能。真实物理环境实验表明,ICE可提升集合通信性能最高达47%。ICE为异构智算网络建设提供了开创性、易部署的解决方案。 展开更多
关键词 异构算力 智算网络 rocev2 通信调度 拥塞控制 负载均衡
在线阅读 下载PDF
RDMA乱序数据包处理技术研究综述
4
作者 马建东 郭志川 《网络新媒体技术》 2025年第4期1-10,共10页
远程直接内存访问(RDMA)已经成为数据中心网络(DCN)跨节点高性能数据传输的关键技术。但是,现有的RDMA传输协议,如基于融合以太网的RDMA版本2(RDMA over Converged Ethernet version 2,RoCEv2),仅支持顺序数据包处理。为进一步提高数据... 远程直接内存访问(RDMA)已经成为数据中心网络(DCN)跨节点高性能数据传输的关键技术。但是,现有的RDMA传输协议,如基于融合以太网的RDMA版本2(RDMA over Converged Ethernet version 2,RoCEv2),仅支持顺序数据包处理。为进一步提高数据传输的灵活性,支持多路径传输与选择性重传,如何使RDMA网卡处理乱序数据包成为当下的研究热点。本文总结了RDMA乱序数据包的产生原因与处理方法,同时对涉及的相关技术如数据包排序、乱序数据包直写、位图管理、丢包检测、跨工作队列元素(WQE)的内存一致性、路径选择等进行了介绍。 展开更多
关键词 远程直接内存访问 rocev2 乱序数据包处理 数据包排序 乱序数据包直写
在线阅读 下载PDF
广域抗损高吞吐URDMA技术 被引量:1
5
作者 段晓东 陆璐 +3 位作者 孙滔 李志强 杨红伟 杜宗鹏 《中兴通讯技术》 北大核心 2024年第6期23-30,共8页
随着国家“东数西算”战略实施以及智算、超算业务的快速发展,海量数据广域传输需求不断增多。提出一种广域抗损高吞吐超远程直接内存访问(URDMA)技术方案,通过对传输控制协议/互联网协议(TCP/IP)协议栈的完全卸载,消除中央处理器(CPU)... 随着国家“东数西算”战略实施以及智算、超算业务的快速发展,海量数据广域传输需求不断增多。提出一种广域抗损高吞吐超远程直接内存访问(URDMA)技术方案,通过对传输控制协议/互联网协议(TCP/IP)协议栈的完全卸载,消除中央处理器(CPU)对网络高吞吐性能的限制。采用拥塞控制、丢包恢复、丢包重传等技术增强标准第2代基于融合以太网的远程直接内存访问(RoCEv2)协议,使其在广域有损网络下保持高吞吐性能。测试结果表明,在往返时延(RTT)时延为20 ms、丢包率0.1%的网络环境下,TCP协议吞吐性能仅为0.02 Gbit/s,标准RoCEv2性能接近为0,URDMA协议吞吐性能为88.26 Gbit/s;当RTT时延增加到80 ms时,TCP和RoCEv2协议吞吐基本衰减为0,URDMA协议吞吐性能为83.12 Gbit/s,仍然保持较高的性能。 展开更多
关键词 广域抗损高吞吐 数据快递 远程直接内存访问 rocev2
在线阅读 下载PDF
面向复杂制造业协同云平台的高速数据传输技术
6
作者 方隽 吴腾云 +2 位作者 梁玉旋 王文耀 杨邦杰 《电子设计工程》 2024年第20期172-176,共5页
针对复杂制造业协同平台之间信息数据传输效率较低这一问题,文中提出了一种新型的面向制造业协同云平台的高速数据传输技术方案。该方案采用OPC UA通信架构作为数据传输的主体架构,在每个OPC服务器内置RoCEv2通信协议,并使用Spark数据... 针对复杂制造业协同平台之间信息数据传输效率较低这一问题,文中提出了一种新型的面向制造业协同云平台的高速数据传输技术方案。该方案采用OPC UA通信架构作为数据传输的主体架构,在每个OPC服务器内置RoCEv2通信协议,并使用Spark数据分析处理引擎作为数据处理核心,构建了基于RoCEv2和Spark的OPC高速数据传输链路。利用Spark设计算法实现对传输数据的分类处理,从而提升了平台间的整体传输效率。实验测试结果表明,该技术方案的可行性较高,与同类文献数据相比,该方案数据的传输延迟减少约49.3%,数据传输速率提升了42.3%,数据传输完整性良好,为现代复杂制造业的海量数据传输提供了一种新的解决方案。 展开更多
关键词 OPC rocev2通信协议 高速数据传输 云平台
在线阅读 下载PDF
基于DPU芯片的RDMA atomic操作的硬件实现
7
作者 吴小林 王万财 高志 《信息技术与信息化》 2024年第9期167-171,共5页
RDMA 网络具有高带宽、低延时、低CPU负载的特点,广泛应用于数据中心。RDMA技术中的RoCEv2由于兼容当前数据中心的网络层与数据链路层,而被认为是一种低成本的RDMA技术解决方案。介绍了一种DPU芯片中RDMA atomic操作的硬件实现。DPU芯... RDMA 网络具有高带宽、低延时、低CPU负载的特点,广泛应用于数据中心。RDMA技术中的RoCEv2由于兼容当前数据中心的网络层与数据链路层,而被认为是一种低成本的RDMA技术解决方案。介绍了一种DPU芯片中RDMA atomic操作的硬件实现。DPU芯片基于RoCEv2协议,在网络拥塞出现丢包时,能够实现RDMA atomic操作在响应端最多执行一次的要求。在硬件电路功能仿真中,已实现了该需求,且重传RDMA atomic操作的延迟相比之前缩短了至少2 μs。 展开更多
关键词 RDMA rocev2 RDMA atomic
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部