期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Kokkos模板元编程的性能可移植求解器开发
1
作者
郑亮
黎坤运
+6 位作者
周兴彬
李永辉
于要杰
向玉开
胡健
柴华
郭黎
《数据与计算发展前沿》
2024年第1期12-20,共9页
【目的】解决面向多样化异构计算架构的求解器应用编程问题。【应用背景】超级计算机的硬件架构日益多样化,新的异构架构因生态不够完善,往往导致软件移植研发门槛过高、研发周期过长,以及存在针对不同硬件反复适配、移植等问题。【方...
【目的】解决面向多样化异构计算架构的求解器应用编程问题。【应用背景】超级计算机的硬件架构日益多样化,新的异构架构因生态不够完善,往往导致软件移植研发门槛过高、研发周期过长,以及存在针对不同硬件反复适配、移植等问题。【方法】在Kokkos代数算子库基础上,开发一套面向国产E级计算环境的“性能可移植”模板元接口开源框架,用于线性代数求解器编程。【结果】本文给出其用于Krylov子空间算法的简单编程示范,实现了面向国产异构处理器的线性代数求解器移植,部分求解器相较于10核超线程Xeon CPU有数十倍以上加速。【结论】性能可移植编程可成为应对多样化异构计算的解决方案。
展开更多
关键词
性能可移植
Kokkos
模板元编程
线性代数求解器
在线阅读
下载PDF
职称材料
题名
基于Kokkos模板元编程的性能可移植求解器开发
1
作者
郑亮
黎坤运
周兴彬
李永辉
于要杰
向玉开
胡健
柴华
郭黎
机构
国家超级计算成都中心
出处
《数据与计算发展前沿》
2024年第1期12-20,共9页
基金
工信部产业技术基础公共服务平台面向人工智能创新应用先导区的应用场景公共服务平台建设项目-成都人工智能应用发展产业技术基础公共服务平台建设(CEIEC-2021-ZM02-0166)
四川省科技计划面向工业软件的作业管理技术研究与应用(2022YFG0040)
光合基金(GHFUND202107014373)。
文摘
【目的】解决面向多样化异构计算架构的求解器应用编程问题。【应用背景】超级计算机的硬件架构日益多样化,新的异构架构因生态不够完善,往往导致软件移植研发门槛过高、研发周期过长,以及存在针对不同硬件反复适配、移植等问题。【方法】在Kokkos代数算子库基础上,开发一套面向国产E级计算环境的“性能可移植”模板元接口开源框架,用于线性代数求解器编程。【结果】本文给出其用于Krylov子空间算法的简单编程示范,实现了面向国产异构处理器的线性代数求解器移植,部分求解器相较于10核超线程Xeon CPU有数十倍以上加速。【结论】性能可移植编程可成为应对多样化异构计算的解决方案。
关键词
性能可移植
Kokkos
模板元编程
线性代数求解器
Keywords
performance portability
Kokkos
template metaprogramming
linear algebra problem solver
分类号
TP311.52 [自动化与计算机技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Kokkos模板元编程的性能可移植求解器开发
郑亮
黎坤运
周兴彬
李永辉
于要杰
向玉开
胡健
柴华
郭黎
《数据与计算发展前沿》
2024
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部