期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向异构众核处理器MT-3000的PanguLU混合精度优化方法
1
作者 张思为 李军贤 +1 位作者 李易达 刘伟峰 《数值计算与计算机应用》 2025年第4期386-397,共12页
在大规模线性系统求解中,传统稀疏直接法解法器往往采用单一精度计算方式,难以灵活平衡计算效率与数值精度.为解决该问题,基于分布式稀疏直接法解法器PanguLU提出了一种面向异构众核处理器MT-3000的混合精度优化算法.该算法依据矩阵块... 在大规模线性系统求解中,传统稀疏直接法解法器往往采用单一精度计算方式,难以灵活平衡计算效率与数值精度.为解决该问题,基于分布式稀疏直接法解法器PanguLU提出了一种面向异构众核处理器MT-3000的混合精度优化算法.该算法依据矩阵块的空间位置与数值敏感性动态选择块存储精度,从而在数值分解阶段实现混合精度计算,同时,针对解法器中的通用矩阵乘子任务,设计了一种计算与存储精度分离的流水线机制.实验结果表明,所提出的方法在数值分解阶段实现了1.04倍至1.19倍的性能提升,同时将相对残差较单精度方案降低了1.97倍至4.15倍,在提升求解速度的同时有效控制了精度损失. 展开更多
关键词 稀疏直接法解法器 pangulu MT-3000 混合精度
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部