期刊文献+
共找到1,408篇文章
< 1 2 71 >
每页显示 20 50 100
生命体系量子力学力场程序在新一代国产超算的千万核并行实现
1
作者 郭剑萍 毛瑞超 +2 位作者 张邯 张勇 高军 《数据与计算发展前沿(中英文)》 2025年第6期158-169,共12页
【目的】旨在新一代国产超算上实现量子力学力场方法X-Pol的千万核高效并行。【方法】开发了PyXPOL程序,该程序是量子力学力场方法的Python实现,采用MPI+Athread两级并行构架。通过引入邻居列表方法,实现了非键相互作用的并行计算。采... 【目的】旨在新一代国产超算上实现量子力学力场方法X-Pol的千万核高效并行。【方法】开发了PyXPOL程序,该程序是量子力学力场方法的Python实现,采用MPI+Athread两级并行构架。通过引入邻居列表方法,实现了非键相互作用的并行计算。采用计算量S型排序优化方法,实现了负载均衡。结合SW26010-Pro处理器的特点,对X-Pol模型中的量子化学计算程序进行了优化。【结果】结果表明,PyXPOL程序实现了千万核规模的弱可扩展性计算。千万核相较于5万核的并行效率可达75%。此外,PyXPOL程序实现了十七万原子生物体系的大规模并行计算,300万核相对于5万核并行效率达82%。【结论】PyXPOL程序在新一代国产超算上实现了量子力学力场方法X-Pol的高效并行,显著提高了大规模生物分子体系的计算效率,为量子力学力场方法在大规模并行计算中的应用提供了有力工具。 展开更多
关键词 显性极化(X-Pol)模型 两级并行 量子化学力场
在线阅读 下载PDF
云计算服务与大规模定制模式应用 被引量:16
2
作者 吴清烈 郭昱 武忠 《电信科学》 北大核心 2010年第9期74-78,共5页
云计算是为适应IT应用新需求出现的一种计算新模式,大规模定制是为适应客户个性化需求所出现的生产或服务新模式。本文在分析云计算服务与大规模定制模式的特点和相互影响的基础上,首先讨论在云计算服务中大规模定制模式应用的必要性,... 云计算是为适应IT应用新需求出现的一种计算新模式,大规模定制是为适应客户个性化需求所出现的生产或服务新模式。本文在分析云计算服务与大规模定制模式的特点和相互影响的基础上,首先讨论在云计算服务中大规模定制模式应用的必要性,然后讨论如何运用云计算服务支持大规模定制模式应用,最后讨论云计算环境下大规模定制客户需求响应互动过程的智能支持。 展开更多
关键词 云计算 个性化需求 大规模定制
在线阅读 下载PDF
用于高热流密度器件冷却的热管散热器实验研究 被引量:11
3
作者 诸凯 李媛媛 陆佩强 《低温与超导》 CAS CSCD 北大核心 2011年第1期42-46,共5页
针对大型计算机服务器CPU的耗能量,探讨了一种新的热管排布方式的散热器,并对其散热性能进行了实验研究。研究结果表明,采用此种热管散热器,最高热流密度为74.3W/cm2,其冷却风速控制在4m/s即可满足芯片冷却要求。同时根据模拟计算得到... 针对大型计算机服务器CPU的耗能量,探讨了一种新的热管排布方式的散热器,并对其散热性能进行了实验研究。研究结果表明,采用此种热管散热器,最高热流密度为74.3W/cm2,其冷却风速控制在4m/s即可满足芯片冷却要求。同时根据模拟计算得到的散热器底板温度分布,可有助于对热管排布方式的优化设计。 展开更多
关键词 热控制 热管 散热器 CPU
在线阅读 下载PDF
面向异构并行计算系统的流水线式压缩检查点 被引量:3
4
作者 刘勇鹏 王锋 +1 位作者 卢凯 刘勇燕 《电子学报》 EI CAS CSCD 北大核心 2012年第2期223-229,共7页
在大规模并行计算系统中,并行检查点触发大量结点同时保存计算状态,造成巨大文件存储空间开销,以及对通信和存储系统的巨大访问压力.数据压缩可以缩小检查点文件尺寸,从而降低存储空间开销以及对通信和存储系统的访问压力.但是,它也带... 在大规模并行计算系统中,并行检查点触发大量结点同时保存计算状态,造成巨大文件存储空间开销,以及对通信和存储系统的巨大访问压力.数据压缩可以缩小检查点文件尺寸,从而降低存储空间开销以及对通信和存储系统的访问压力.但是,它也带来额外的压缩计算开销.本文针对异构并行计算系统,提出流水线式并行压缩检查点技术,采用一系列优化技术来降低压缩引入的计算延时,包括:流水线式双重写缓存队列、文件写操作的合并、GPU加速的流水压缩算法和GPU资源的多进程调度,等等.本文介绍了该技术在天河一号系统中的实现,并对所实现的检查点系统进行综合评测.实验数据表明该方法在大规模异构并行计算系统中是可行、高效、实用的. 展开更多
关键词 异构并行体系结构 检查点 数据压缩 软流水线 图形处理器
在线阅读 下载PDF
面向GPU计算集群的高效液冷换热系统设计
5
作者 白瑞晨 林子杰 《信息与电脑》 2025年第22期134-136,共3页
随着图形处理器(Graphics Processing Unit,GPU)计算集群在人工智能、高性能计算领域的广泛应用,单节点功耗已突破50 kW。传统风冷系统面临散热效率不足、能耗比过高的瓶颈。文章设计了一种面向GPU计算集群的高效液冷换热系统,可实现散... 随着图形处理器(Graphics Processing Unit,GPU)计算集群在人工智能、高性能计算领域的广泛应用,单节点功耗已突破50 kW。传统风冷系统面临散热效率不足、能耗比过高的瓶颈。文章设计了一种面向GPU计算集群的高效液冷换热系统,可实现散热效率与能耗的协同优化。实验结果表明,该系统能够满足高密度计算集群的动态散热需求。 展开更多
关键词 GPU计算集群 液冷换热 系统设计 散热效率 能耗
在线阅读 下载PDF
一种专用可重配置的FPGA嵌入式存储器模块的设计和实现 被引量:7
6
作者 余慧 王健 《电子学报》 EI CAS CSCD 北大核心 2012年第2期215-222,共8页
本文设计了一种满足FPGA芯片专用定制需求的嵌入式可重配置存储器模块.一共8块,每块容量为18Kbits的同步双口BRAM,可以配置成16K×1bit、8K×2bits、4K×4bits、2K×9bits、1K×18bits、512×36bits六种不同的... 本文设计了一种满足FPGA芯片专用定制需求的嵌入式可重配置存储器模块.一共8块,每块容量为18Kbits的同步双口BRAM,可以配置成16K×1bit、8K×2bits、4K×4bits、2K×9bits、1K×18bits、512×36bits六种不同的位宽工作模式;write-first、no-change两种不同的写入模式.多个BRAM还可以通过FPGA中互连电路的级联来实现深度或宽度的扩展.本文重点介绍实现可重配置功能的电路及BRAM嵌入至FPGA中的互连电路.采用SMIC 0.13μm 8层金属CMOS工艺,产生FDP-II芯片的完整版图并成功流片,芯片面积约为4.5mm×4.4mm.运用基于March C+算法的MBIST测试方法,软硬件协同测试,结果表明FDP-II中的BRAM无任何故障,可重配置功能正确,证实了该存储器模块的设计思想. 展开更多
关键词 嵌入式存储器 可重配置 FPGA 互连 灵敏放大器
在线阅读 下载PDF
高性能计算在科学模拟中的应用与发展
7
作者 白昌盛 《通讯世界》 2025年第12期158-160,共3页
高性能计算(high performance computing, HPC)能够以极高的速度处理海量数据集并解决复杂问题,在科学模拟领域展现出显著的优势。基于此,对HPC在科学模拟中的应用现状与优势进行阐述,分析目前HPC应用于科学模拟面临的主要问题,并提出... 高性能计算(high performance computing, HPC)能够以极高的速度处理海量数据集并解决复杂问题,在科学模拟领域展现出显著的优势。基于此,对HPC在科学模拟中的应用现状与优势进行阐述,分析目前HPC应用于科学模拟面临的主要问题,并提出有针对性的优化策略,包括优化硬件与架构设计、优化算法与模拟软件、加强资源共享与协作机制建设、加强普及工作与教育培训等,以期为相关研究者提供参考,实现HPC在科学模拟中的深度应用,提高科学模拟的效率和质量。 展开更多
关键词 高性能计算 科学模拟 并行计算 技术优化
在线阅读 下载PDF
基于BIM与CFD融合的超算中心冷却系统优化设计研究
8
作者 余杰 姚望 +2 位作者 雍怡峰 沈亚辉 钟孟羽 《互联网周刊》 2025年第23期43-45,共3页
为了提升超算中心冷却系统的能效与运行质量,本文提出并实践了一套基于BIM与CFD深度融合的冷却系统优化设计方法。通过集成多源传感监测、三维建模、流场仿真、智能决策、施工反馈,实现从设计到运行的全过程闭环优化。研究内容涵盖气流... 为了提升超算中心冷却系统的能效与运行质量,本文提出并实践了一套基于BIM与CFD深度融合的冷却系统优化设计方法。通过集成多源传感监测、三维建模、流场仿真、智能决策、施工反馈,实现从设计到运行的全过程闭环优化。研究内容涵盖气流组织优化、施工精度提升、质量管控、能效调优。结果表明,该方法能够显著提升气流分布均匀性和系统能效,确保冷却系统的高效、稳定、绿色运行,为超算中心节能降耗提供了有力支撑。 展开更多
关键词 超算中心 BIM-CFD融合 冷却系统优化 能效提升
在线阅读 下载PDF
基于自主计算体系的汽车研发CAE仿真算力平台设计与实现
9
作者 贾越 张兴隆 +3 位作者 李清泽 高旭 陶建尧 刘慧 《汽车与驾驶维修》 2025年第11期59-61,共3页
针对汽车研发对高并发、高可信CAE仿真的迫切需求,本文提出基于自主计算体系的仿真算力平台软件,构建“本地计算节点—中央调度网关—云边平台”三级松耦合架构,实现双通道并行调度、容器化工具链隔离与区块链式日志存证。实验显示,GPU... 针对汽车研发对高并发、高可信CAE仿真的迫切需求,本文提出基于自主计算体系的仿真算力平台软件,构建“本地计算节点—中央调度网关—云边平台”三级松耦合架构,实现双通道并行调度、容器化工具链隔离与区块链式日志存证。实验显示,GPU利用率最高达0.90,故障恢复成功率超0.90,验证了平台在弹性算力供给、故障自愈与可追溯性方面的有效性。 展开更多
关键词 自主计算体系 CAE仿真 算力调度
在线阅读 下载PDF
基于剪枝优化的多变邻域节能调度算法 被引量:2
10
作者 仇宾 孙曼曼 崔素丽 《应用科学学报》 CAS CSCD 北大核心 2022年第2期349-360,共12页
为了提高异构计算机系统中任务调度的节能水平,提出了融合剪枝优化的多变邻域节能调度算法。算法构建处理机约束和时间约束两个邻域结构,借助处理机约束邻域减少冗余处理机量,从而降低整体能耗;利用时间约束邻域有效缩减关键路径长度,... 为了提高异构计算机系统中任务调度的节能水平,提出了融合剪枝优化的多变邻域节能调度算法。算法构建处理机约束和时间约束两个邻域结构,借助处理机约束邻域减少冗余处理机量,从而降低整体能耗;利用时间约束邻域有效缩减关键路径长度,实现了任务调度对时间的要求。提出了基于时间和能耗的剪枝优化策略,以提高局部寻优效率。通过仿真实验和实际问题求解对比可知,所提算法在不同问题规模、处理机量和通信比下,都取得了较好的节能效果。 展开更多
关键词 节能任务调度 变邻域结构 处理机约束 时间约束 剪枝优化
在线阅读 下载PDF
多级网络多处理机系统的性能评估 被引量:2
11
作者 刘整社 文传源 张明廉 《计算机学报》 EI CSCD 北大核心 1991年第1期63-67,共5页
本文建立了多级网络(δ-网)多处理机系统的马尔柯夫模型,为系统结构参数和任务粒度的选择提供了依据。文中分析了处理机数目、网络结构参数和任务粒度对系统性能的影响,并对模型计算结果和仿真结果作了比较。
关键词 多处理机系统 性能 网络 多级网络
在线阅读 下载PDF
多总线多处理机系统的性能仿真 被引量:2
12
作者 刘整社 文传源 张明廉 《计算机学报》 EI CSCD 北大核心 1990年第9期651-660,共10页
对四种典型的公用存贮器型多总线多处理机系统,给出处理效率的仿真估计方法。该方法适用于任意规模的系统。同时,访问公用存贮器的请求间隔和一次公用存贮器的操作时间都可以服从任意分布,并且处理机可按任意概率访问各公用存贮器模块。
关键词 总线 多处理机系统 仿真 MBMP系统
在线阅读 下载PDF
万亿次机群系统高性能应用软件运行现状分析 被引量:2
13
作者 侯晓吻 张林波 张云泉 《计算机工程》 EI CAS CSCD 北大核心 2005年第22期81-83,共3页
通过调用PAPI(PerformanceApplicationProgrammingInterface)接口函数[6]对2004年3月~4月之间运行在国家应用“973”计划项目LSSC-II万亿次机群系统上部分应用程序进行了跟踪,收集到了大量宝贵的性能数据。依据这些性能数据信息,对我... 通过调用PAPI(PerformanceApplicationProgrammingInterface)接口函数[6]对2004年3月~4月之间运行在国家应用“973”计划项目LSSC-II万亿次机群系统上部分应用程序进行了跟踪,收集到了大量宝贵的性能数据。依据这些性能数据信息,对我国当前高性能软件的运行情况给出了初步分析。分析结果表明,目前大部分应用程序性能都处于较低水平,并行程序使用处理器的数目范围一般为1~64个,处理器平均效率低于10%,平均性能低于300Mflops。 展开更多
关键词 高性能计算 高性能应用软件 性能分析
在线阅读 下载PDF
面向大规模计算系统的Cache式并行检查点 被引量:1
14
作者 刘勇燕 刘勇鹏 +1 位作者 冯华 迟万庆 《计算机科学》 CSCD 北大核心 2011年第5期287-289,F0003,共4页
检查点机制是高性能并行计算系统中重要的容错手段,随着系统规模的增大,并行检查点的可扩展性受文件访问的制约。针对大规模并行计算系统的多级文件系统结构,提出了cache式并行检查点技术。它将全局同步并行检查点转化为局部文件操作,... 检查点机制是高性能并行计算系统中重要的容错手段,随着系统规模的增大,并行检查点的可扩展性受文件访问的制约。针对大规模并行计算系统的多级文件系统结构,提出了cache式并行检查点技术。它将全局同步并行检查点转化为局部文件操作,并利用多处理器结构进行乱序流水线式写回调度,将检查点的写回时机合理分布,从而有效地隐藏了检查点的写回开销,保证了并行检查点文件访问的高性能和高可扩展性。 展开更多
关键词 Cache式检查点 并行计算 多级文件系统 多处理器 乱序流水线
在线阅读 下载PDF
一种对应用透明的分布式系统性能分析方法 被引量:3
15
作者 马晓晨 孔小利 《计算机工程与应用》 CSCD 北大核心 2008年第17期107-110,共4页
分布式系统的性能问题分析是一个公认的难题。以往的很多研究应用相关的数据和方法分析应用性能,这些方法通常需要对应用代码进行修改从而获取必要的执行信息。论文提供了一种针对分布式系统性能问题的新的分析方法,该方法通过动态探针... 分布式系统的性能问题分析是一个公认的难题。以往的很多研究应用相关的数据和方法分析应用性能,这些方法通常需要对应用代码进行修改从而获取必要的执行信息。论文提供了一种针对分布式系统性能问题的新的分析方法,该方法通过动态探针获取通信信息,通过分析分布式系统的通信模式对性能问题进行诊断。实验证明该方法具有通用性和高效性。 展开更多
关键词 分布式系统 性能问题 动态探针
在线阅读 下载PDF
银河亿次巨型计算机工程组织管理研究 被引量:3
16
作者 赵阳辉 吴迪 《科技管理研究》 北大核心 2010年第3期9-11,16,共4页
中国巨型计算机技术是在国家高度重视、正确领导下发展起来的,是改革开放、大力协作的产物。从工程哲学的视角,分析银河亿次巨型计算机工程的决策背景,探讨其指导思想、组织机构、队伍建设、规章制度和政治工作等方面的改进与创新,对于... 中国巨型计算机技术是在国家高度重视、正确领导下发展起来的,是改革开放、大力协作的产物。从工程哲学的视角,分析银河亿次巨型计算机工程的决策背景,探讨其指导思想、组织机构、队伍建设、规章制度和政治工作等方面的改进与创新,对于当代中国工程创新的理论与实践,具有积极意义。 展开更多
关键词 工程创新 银河亿次巨型计算机 组织管理
在线阅读 下载PDF
使用程控开关的超级立方体计算机系统 被引量:2
17
作者 刘心松 李岳 《电子学报》 EI CAS CSCD 北大核心 1993年第5期47-53,共7页
结点间的通信速度是并行处理系统的成败关键之一,超级并行计算机采用超立方体拓扑结构已成主流,本文提出的程控开关型超立方体拓扑结构大幅度提高了通信速度,为超立方体型超级并行计算机提供了强有力的支持。
关键词 程控开关 超立方体 并行计算机
在线阅读 下载PDF
战斗机发动机的研制现状和发展趋势 被引量:60
18
作者 林左鸣 《航空发动机》 2006年第1期1-8,共8页
介绍了第三代战斗机发动机的设计特点和研制规律;综述了F119和F135等第四代战斗机发动机的研制现状,总结了其性能和结构特点;归纳了战斗机发动机性能、结构和材料的发展趋势;展望了未来战斗机发动机的发展。
关键词 战斗机发动机 性能 结构 材料 发展趋势
在线阅读 下载PDF
面向国产超算的深度学习框架算子的移植与适配
19
作者 周法国 刘芳 +6 位作者 王彦棡 王珏 于淼 李顺德 周纯葆 王婧 杨沁蒙 《数据与计算发展前沿(中英文)》 2025年第6期136-148,共13页
【应用背景】随着大规模深度学习模型的快速发展,训练大规模模型所需的计算资源不断提升,单一的计算设备已难以满足大规模深度学习模型的训练需求。因此,在深度学习领域,使深度学习框架支持超算平台具有重要的战略意义。作为国产自主研... 【应用背景】随着大规模深度学习模型的快速发展,训练大规模模型所需的计算资源不断提升,单一的计算设备已难以满足大规模深度学习模型的训练需求。因此,在深度学习领域,使深度学习框架支持超算平台具有重要的战略意义。作为国产自主研发的深度学习框架,MindSpore凭借其高效的计算性能、灵活的调试功能以及对分布式训练的便捷支持,成为人工智能研究领域的重要工具之一。【问题】MindSpore框架并不支持曙光高性能计算机,无法在该超算平台上直接部署和运行,严重地限制了MindSpore框架在超算环境中的应用。【方法】针对MindSpore框架无法在曙光高性能计算机上运行的问题,本文基于曙光高性能计算机的硬件架构和软件环境,对MindSpore框架进行了移植与适配。曙光高性能计算机采用CPU与海光DCU的异构架构,MindSpore框架对该超算平台的不支持,表现为框架中的算子无法在海光DCU上调度执行,因此本文以框架中的原始GPU算子为基础,设计了面向海光DCU的算子移植方案。【结果】依据面向海光DCU的算子移植方案,本文共成功移植了278个算子,使得MindSpore框架能够在曙光高性能计算机上运行。并在曙光高性能计算机上,对LLaMA模型进行了分布式并行训练,验证了MindSpore框架中海光DCU算子良好的执行性能。 展开更多
关键词 深度学习框架 超级计算机 算子移植 分布式并行训练
在线阅读 下载PDF
锦绣文章傲群伦,精博学问育桃李——敬贺恩师刘东生先生九十华诞 被引量:1
20
作者 丁仲礼 朱日祥 《第四纪研究》 CAS CSCD 北大核心 2007年第6期911-914,共4页
关键词 刘东生 国家最高科技奖 中国科学院 学术成就 系统整理 学术贡献
在线阅读 下载PDF
上一页 1 2 71 下一页 到第
使用帮助 返回顶部