期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向异构众核处理器MT-3000的PanguLU混合精度优化方法
1
作者
张思为
李军贤
+1 位作者
李易达
刘伟峰
《数值计算与计算机应用》
2025年第4期386-397,共12页
在大规模线性系统求解中,传统稀疏直接法解法器往往采用单一精度计算方式,难以灵活平衡计算效率与数值精度.为解决该问题,基于分布式稀疏直接法解法器PanguLU提出了一种面向异构众核处理器MT-3000的混合精度优化算法.该算法依据矩阵块...
在大规模线性系统求解中,传统稀疏直接法解法器往往采用单一精度计算方式,难以灵活平衡计算效率与数值精度.为解决该问题,基于分布式稀疏直接法解法器PanguLU提出了一种面向异构众核处理器MT-3000的混合精度优化算法.该算法依据矩阵块的空间位置与数值敏感性动态选择块存储精度,从而在数值分解阶段实现混合精度计算,同时,针对解法器中的通用矩阵乘子任务,设计了一种计算与存储精度分离的流水线机制.实验结果表明,所提出的方法在数值分解阶段实现了1.04倍至1.19倍的性能提升,同时将相对残差较单精度方案降低了1.97倍至4.15倍,在提升求解速度的同时有效控制了精度损失.
展开更多
关键词
稀疏直接法解法器
pangulu
MT-3000
混合精度
原文传递
题名
面向异构众核处理器MT-3000的PanguLU混合精度优化方法
1
作者
张思为
李军贤
李易达
刘伟峰
机构
中国石油大学(北京)计算机科学与技术系
出处
《数值计算与计算机应用》
2025年第4期386-397,共12页
基金
国家重点研发计划(2023YFB3001604)
国家自然科学基金(62372467,U23A20301)资助.
文摘
在大规模线性系统求解中,传统稀疏直接法解法器往往采用单一精度计算方式,难以灵活平衡计算效率与数值精度.为解决该问题,基于分布式稀疏直接法解法器PanguLU提出了一种面向异构众核处理器MT-3000的混合精度优化算法.该算法依据矩阵块的空间位置与数值敏感性动态选择块存储精度,从而在数值分解阶段实现混合精度计算,同时,针对解法器中的通用矩阵乘子任务,设计了一种计算与存储精度分离的流水线机制.实验结果表明,所提出的方法在数值分解阶段实现了1.04倍至1.19倍的性能提升,同时将相对残差较单精度方案降低了1.97倍至4.15倍,在提升求解速度的同时有效控制了精度损失.
关键词
稀疏直接法解法器
pangulu
MT-3000
混合精度
Keywords
Sparse direct solver
pangulu
MT-3000
Mixed-precision
分类号
TP332 [自动化与计算机技术—计算机系统结构]
原文传递
题名
作者
出处
发文年
被引量
操作
1
面向异构众核处理器MT-3000的PanguLU混合精度优化方法
张思为
李军贤
李易达
刘伟峰
《数值计算与计算机应用》
2025
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部