检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

多核龙芯3A上二级BLAS库的优化被引量：8: 1; 作者李毅何颂颂李恺《计算机系统应用》 2011年第1期163-167,共5页; 针对龙芯3A体系结构以及二级BLAS库函数的特点,在指令级、存储级和线程级抽取并行方案,总结了一些合适的优化方法,并对其进行了定量的分析。实验表明,这些优化可以将二级BLAS函数单线程的性能提升20%以上,多线程下也可以得到2.5倍左右... 展开更多; 关键词龙芯3A BLAS 优化 gemv GER 访存多线程; 在线阅读下载PDF 职称材料

面向商用存算一体架构矩阵乘算子协同优化策略研究: 2; 作者贺煜凯谢童欣 +2 位作者朱振华高岚李冰《电子与信息学报》北大核心 2025年第9期3187-3197,共11页; 由于近存架构对数据密集型程序加速的潜力,Samsung等公司推出基于高带宽存储器与存内计算(HBM-PIM)的近存芯片用于大模型加速,得益于HBM的高带宽和天然并行特性,近存计算表现出对大模型极佳的加速。该文发现,矩阵规模变化时,HBM-PIM架... 展开更多; 关键词存算一体算子性能优化矩阵乘算子数据并行地址映射策略; 在线阅读下载PDF 职称材料

基于申威1621的通用矩阵向量乘法的性能分析与优化被引量：2: 3; 作者邓洁赵荣彩王磊《计算机应用》 CSCD 北大核心 2022年第S01期215-220,共6页; 通用矩阵向量乘法(GEMV)函数是整个二级基础线性代数子程序(BLAS)函数库的构建基础,BLAS作为关键基础计算软件之一,目前在申威处理器上却没有一个高性能实现的版本。针对上述问题,为充分发挥申威1621平台的高性能BLAS库计算优势,提出一... 展开更多; 关键词申威1621 基础线性代数子程序函数库单指令多数据流通用矩阵向量乘法性能优化; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部