检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

HiTrain:面向大模型训练的异构内存卸载与I/O优化: 1; 作者汤志航兰颢 +3 位作者刘政国汪庆赵来平李克秋《计算机研究与发展》北大核心 2026年第3期627-639,共13页; 随着大语言模型(large language models,LLMs)(以下简称“大模型”)参数规模的持续增长,微调百亿级参数大模型对计算和存储资源提出了极高要求。传统分布式训练方案通常依赖大量高端GPU和高速互联网络,训练成本极为昂贵。现有单GPU训练... 展开更多; 关键词大模型训练异构内存张量卸载用户态高性能I/O 存储-计算流水线; 在线阅读下载PDF 职称材料

资源受限场景下基于算子感知的大模型推理张量卸载方法: 2; 作者张建锋谢栋 +4 位作者蹇松雷李宝王晓川郭勇余杰《国防科技大学学报》北大核心 2025年第6期60-70,共11页; 在一些资源受限场景下,大语言模型的高效推理部署面临严峻挑战。当前主流的模型推理优化技术,虽然在一定程度上提高了模型推理效率,但是仍然存在部署粒度较为粗糙、推理精度较差等问题。根据不同算子对GPU亲和度不同的发现,提出算子感... 展开更多; 关键词大语言模型资源受限模型推理算子GPU亲和度算子感知张量卸载方法; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部