检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

面向深度学习的批处理矩阵乘法设计与实现被引量：8: 1; 作者黄春姜浩 +3 位作者全哲左克何楠刘文超《计算机学报》 EI CAS CSCD 北大核心 2022年第2期225-239,共15页; 本文设计并实现了面向深度学习的统一框架批处理矩阵乘法.我们细致地分析了利用矩阵乘法实现卷积的过程中卷积核、输入特征图和输出特征图在NCHW和NHWC两类存储格式下的矩阵数据排列特点,指出了其和矩阵行列主序的关系.在此基础上,为了... 展开更多; 关键词批处理矩阵乘法卷积分块算法深度学习数据排列; 在线阅读下载PDF 职称材料

Optimizing winograd-based convolution with DCU’s matrix cores: 2; 作者 Jiandong Shang Fuchang Gao +5 位作者 Zhaopeng Li Yizhe Sui Gang Wu Nan Wang Lingling Wang Dujuan Zhang 《CCF Transactions on High Performance Computing》 2026年第1期107-119,共13页; Convolution algorithms based on the Winograd implementation can reduce computational complexity and are widely used in CNNs.As an emerging GPU-like accelerator,DCU has achieved some performance optimization for the Wi... 展开更多; 关键词 Convolution Fused Winograd batched gemms Matrix Cores; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	面向深度学习的批处理矩阵乘法设计与实现	黄春姜浩全哲左克何楠刘文超	《计算机学报》 EI CAS CSCD 北大核心	2022	8	在线阅读下载PDF 职称材料
2	Optimizing winograd-based convolution with DCU’s matrix cores	Jiandong Shang Fuchang Gao Zhaopeng Li Yizhe Sui Gang Wu Nan Wang Lingling Wang Dujuan Zhang	《CCF Transactions on High Performance Computing》	2026		在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部