检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

Minimizing transformer inference overhead using controlling element on Shenwei AI accelerator: 1; 作者 Yulong ZHAO Chunzhi WU +7 位作者 Yizhuo WANG Lufei ZHANG Yaguang ZHANG Wenyuan SHEN Hao FAN Hankang FANG Yi QIN Xin LIU 《Frontiers of Information Technology & Electronic Engineering》 2025年第4期605-622,共18页; Transformer models have become a cornerstone of various natural language processing(NLP)tasks.However,the substantial computational overhead during the inference remains a significant challenge,limiting their deployme... 展开更多; 关键词 Transformer inference optimization Three-tier scheduling zero-copy memory management Fast model loading; 原文传递

	题名	作者	出处	发文年	被引量	操作
1	Minimizing transformer inference overhead using controlling element on Shenwei AI accelerator	Yulong ZHAO Chunzhi WU Yizhuo WANG Lufei ZHANG Yaguang ZHANG Wenyuan SHEN Hao FAN Hankang FANG Yi QIN Xin LIU	《Frontiers of Information Technology & Electronic Engineering》	2025	0	原文传递

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部