期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
Multi-Agent Deep Reinforcement Learning-Based Resource Allocation in HPC/AI Converged Cluster 被引量:1
1
作者 Jargalsaikhan Narantuya Jun-Sik Shin +1 位作者 Sun Park JongWon Kim 《Computers, Materials & Continua》 SCIE EI 2022年第9期4375-4395,共21页
As the complexity of deep learning(DL)networks and training data grows enormously,methods that scale with computation are becoming the future of artificial intelligence(AI)development.In this regard,the interplay betw... As the complexity of deep learning(DL)networks and training data grows enormously,methods that scale with computation are becoming the future of artificial intelligence(AI)development.In this regard,the interplay between machine learning(ML)and high-performance computing(HPC)is an innovative paradigm to speed up the efficiency of AI research and development.However,building and operating an HPC/AI converged system require broad knowledge to leverage the latest computing,networking,and storage technologies.Moreover,an HPC-based AI computing environment needs an appropriate resource allocation and monitoring strategy to efficiently utilize the system resources.In this regard,we introduce a technique for building and operating a high-performance AI-computing environment with the latest technologies.Specifically,an HPC/AI converged system is configured inside Gwangju Institute of Science and Technology(GIST),called GIST AI-X computing cluster,which is built by leveraging the latest Nvidia DGX servers,high-performance storage and networking devices,and various open source tools.Therefore,it can be a good reference for building a small or middlesized HPC/AI converged system for research and educational institutes.In addition,we propose a resource allocation method for DL jobs to efficiently utilize the computing resources with multi-agent deep reinforcement learning(mDRL).Through extensive simulations and experiments,we validate that the proposed mDRL algorithm can help the HPC/AI converged cluster to achieve both system utilization and power consumption improvement.By deploying the proposed resource allocation method to the system,total job completion time is reduced by around 20%and inefficient power consumption is reduced by around 40%. 展开更多
关键词 Deep learning hpc/ai converged cluster reinforcement learning
在线阅读 下载PDF
智能超算系统的机遇与挑战
2
作者 李斌 戴荣 +2 位作者 万伟 张磊 郑谦 《计算》 2026年第2期31-37,共7页
以ChatGPT为代表的生成式大模型,展现出前所未有的通用能力,并驱动科学研究范式向科学智能(AI for science)转变。这一趋势使得高性能计算与人工智能计算加速融合,超智融合的智能超算系统成为支撑未来大模型发展与科学发现的关键基础设... 以ChatGPT为代表的生成式大模型,展现出前所未有的通用能力,并驱动科学研究范式向科学智能(AI for science)转变。这一趋势使得高性能计算与人工智能计算加速融合,超智融合的智能超算系统成为支撑未来大模型发展与科学发现的关键基础设施。本文对智能超算系统在这一历史性交汇点上面临的重大机遇进行了系统分析,并深入探讨了其在计算芯片、体系结构、硬件系统、软件生态、可靠性与能耗等方面所遭遇的严峻挑战,提出需要软硬件协同设计与全产业链的紧密合作,从而为构建高效、普惠、可持续的新一代智能超算系统奠定基础。 展开更多
关键词 智能超算 人工智能 科学智能 超智融合 大模型 算力基础设施
在线阅读 下载PDF
面向大规模推荐模型推理的HBM-DRAM嵌入向量存储系统
3
作者 楼博涵 敖旭扬 +1 位作者 王永福 李京 《小型微型计算机系统》 北大核心 2026年第4期769-775,共7页
存储大规模推荐模型的嵌入向量特征需要大量的内存(DRAM),嵌入向量的高频查询和跨计算层的传输已成为推荐模型推理的性能瓶颈.GPU的HBM(High Bandwidth Memory)具备TB/s级高带宽,采用HBM来存储、访问嵌入向量可以显著提高推荐模型推理... 存储大规模推荐模型的嵌入向量特征需要大量的内存(DRAM),嵌入向量的高频查询和跨计算层的传输已成为推荐模型推理的性能瓶颈.GPU的HBM(High Bandwidth Memory)具备TB/s级高带宽,采用HBM来存储、访问嵌入向量可以显著提高推荐模型推理的性能,但HBM昂贵且容量有限,无法存放所有的嵌入向量.本文结合推荐场景中存在数据倾斜的特性,设计了一种混合存储系统,使用HBM作为一级存储存放热点嵌入向量加速推理,使用DRAM作为二级存储降低推理成本,实现了面向大规模推荐模型推理的嵌入向量存储系统.实验结果表明,相较于常见的纯DRAM方案,嵌入向量部分的吞吐率提升了14倍;相较于其他使用GPU来存储嵌入向量的实现,采用本系统实现的嵌入向量表,嵌入向量部分的吞吐率有3.8倍的提升. 展开更多
关键词 推荐系统 高性能计算 ai大模型 GPU加速
在线阅读 下载PDF
异构融合智算管理平台的设计与实现
4
作者 陈莉琳 《福建电脑》 2023年第10期73-77,共5页
为了满足不同用户对各种计算软硬件的使用需求,建设一个异构融合的统一算力管理平台十分必要。本文设计并实现了一个数字福建云计算公司智算管理平台,平台采用Slurm调度管理和Singularity容器技术,对算力资源调度管理进行总体规划。实... 为了满足不同用户对各种计算软硬件的使用需求,建设一个异构融合的统一算力管理平台十分必要。本文设计并实现了一个数字福建云计算公司智算管理平台,平台采用Slurm调度管理和Singularity容器技术,对算力资源调度管理进行总体规划。实际使用的结果表明,该平台可为公共用户提供便捷和易用的算力服务。 展开更多
关键词 高性能计算 人工智能 集群调度 容器 管理平台
在线阅读 下载PDF
超智融合高性能计算技术发展探讨
5
作者 卢锡城 杨博 +2 位作者 刘杰 黄立波 陈新海 《计算机工程与科学》 2026年第4期571-579,共9页
高性能计算(HPC)技术演进始终与国防军事、基础科学及产业工程等领域的战略需求紧密交织,其发展历程大致可划分为专用向量机、大规模并行计算机、异构并行计算机和超智融合计算机4个关键阶段,各阶段在体系结构、软件生态和应用模式上不... 高性能计算(HPC)技术演进始终与国防军事、基础科学及产业工程等领域的战略需求紧密交织,其发展历程大致可划分为专用向量机、大规模并行计算机、异构并行计算机和超智融合计算机4个关键阶段,各阶段在体系结构、软件生态和应用模式上不断演进。当前,高性能计算正经历一场由人工智能驱动的深刻范式转移,“AI for Science”成为一种新型科学研究范式,科学计算的高性能、高精度与智能计算的高性能、混合精度特征呈现出深度融合态势,对底层计算架构在精度协同、数据交换以及I/O模式适配等方面提出了严峻挑战。展望未来基于超智融合的高性能计算技术发展,竞争焦点正从单一的浮点峰值性能,转向数据搬移效率、能效比以及系统可扩展性的综合考量。计算单元间更紧密的集成、更高效的数据流动以及更统一的编程抽象,将成为下一代高性能计算系统的关键特征。CPU-SIMT融合计算架构作为一种有前景的超智融合计算体系结构,采用的“融合计算架构+层次化互连网络+融合并行存储”方案,有望突破超智融合紧耦合计算应用的“通信墙”瓶颈,为构建下一代高性能计算系统提供新的技术路径,高效支撑新型“AI for Science”计算范式应用。 展开更多
关键词 高性能计算 ai for Science CPU-SIMT融合计算架构
在线阅读 下载PDF
人机深度协同教学中的教师AI素养:HPC-TDL框架的建构与验证
6
作者 孙强 《人工智能教育研究》 2026年第1期109-131,共23页
生成式人工智能(Generative AI)的快速发展正在深刻改变知识生产方式和课堂教学形态,对传统教师数字素养框架提出了新的挑战。现有国际教师能力框架(如DigCompEdu、ISTE、UNESCO ICTCFT/AI-CFT及中国《教师数字素养》标准)普遍存在将人... 生成式人工智能(Generative AI)的快速发展正在深刻改变知识生产方式和课堂教学形态,对传统教师数字素养框架提出了新的挑战。现有国际教师能力框架(如DigCompEdu、ISTE、UNESCO ICTCFT/AI-CFT及中国《教师数字素养》标准)普遍存在将人工智能视为“工具”的理论预设,难以解释生成式AI背景下的人机协同教学实践。为回应这一理论缺口,本文通过“文献综合—概念建构—Delphi验证”的三阶段研究设计,提出“人机协同教学创制素养框架”(HPC-TDL),并以“深层人机协同”(Deep Human-AI Collaboration,D-HAC)为理论内核,构建包含伦理人文根基、AI认知技术能力、人机协同教学创制、数据洞察循证决策和AI驱动专业反思创生五个维度的教师AI素养结构模型。通过三轮Delphi专家咨询(n=21,来自9个国家),研究结果显示五个维度均获得较高专家共识(均值4.36-4.78,变异系数0.12-0.23,Kendall’s W=0.41,p<0.001),表明该框架具有良好的理论合理性与结构稳定性。在此基础上,本文提出“协同探究—行动研究—分层终身学习”的教师专业发展路径,并讨论生成式人工智能时代教师专业转型面临的制度与实践挑战。研究为人工智能时代教师AI素养框架的理论建构与政策设计提供了新的分析视角。 展开更多
关键词 人机协同教学 教师ai素养 生成式人工智能 hpc-TDL框架 Delphi方法
在线阅读 下载PDF
Challenges and opportunities for a hybrid modelling approach to earth system science
7
作者 Simon See Jeff Adie 《CCF Transactions on High Performance Computing》 2021年第3期320-329,共10页
Artificial Intelligence(AI),particularly in the fields of Machine learning(ML)and Deep learning(DL)have become important tools for the scientific community in general.By coupling traditional modelling and simulation w... Artificial Intelligence(AI),particularly in the fields of Machine learning(ML)and Deep learning(DL)have become important tools for the scientific community in general.By coupling traditional modelling and simulation with the new AI approaches in a hybrid fashion we can advance our current science in leaps and bounds.In the field of Earth System Science(ESS)this is particularly so and,although the technology is still somewhat nascent,the opportunities and potential benefits are enormous.Furthermore,this mixed approach offers a pathway to solving the extremely demanding future science goals in this space that cannot be solved through computing capability alone.This paper examines the state of the art in the application of HPC+AI to the domain of ESS,identifying several important application areas and techniques for hybrid modelling.We also look at the challenges that currently limit widespread adoption of hybrid modelling and delve into potential solutions to those limitations. 展开更多
关键词 hpc+ai Hybrid computing Earth system modelling Deep learning
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部