检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

BAFT:bubble-aware fault-tolerant framework for distributed DNN training with hybrid parallelism: 1; 作者 Runzhe CHEN Guandong LU +6 位作者 Yakai WANG Rui ZHANG Zheng HU Yanming MIAO zhifang cai Jingwen LENG Minyi GUO 《Frontiers of Computer Science》 2025年第1期29-39,共11页; As deep neural networks (DNNs) have been successfully adopted in various domains, the training of these large-scale models becomes increasingly difficult and is often deployed on compute clusters composed of many devi... 展开更多; 关键词 distributed training fault tolerance CHECKPOINT pipeline parallelism error recovery; 原文传递

	题名	作者	出处	发文年	被引量	操作
1	BAFT:bubble-aware fault-tolerant framework for distributed DNN training with hybrid parallelism	Runzhe CHEN Guandong LU Yakai WANG Rui ZHANG Zheng HU Yanming MIAO zhifang cai Jingwen LENG Minyi GUO	《Frontiers of Computer Science》	2025	0	原文传递

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部