期刊文献+
共找到1,805篇文章
< 1 2 91 >
每页显示 20 50 100
基于MPI+OpenMP混合并行的中性束注入传输模拟算法研究
1
作者 邹尚轩 梁立振 +1 位作者 徐兴勤 刘婷 《核电子学与探测技术》 北大核心 2026年第2期217-225,共9页
中性束注入(Neutral Beam Injection,NBI)作为磁约束核聚变装置实现等离子体加热与电流驱动的关键技术,其束流传输特性直接影响装置组件的热负荷分布。针对传统串行计算难以满足大规模中性束传输模拟的问题,本研究基于自主研发的中性束... 中性束注入(Neutral Beam Injection,NBI)作为磁约束核聚变装置实现等离子体加热与电流驱动的关键技术,其束流传输特性直接影响装置组件的热负荷分布。针对传统串行计算难以满足大规模中性束传输模拟的问题,本研究基于自主研发的中性束传输模拟软件BTNSS,提出一种基于MPI+OpenMP混合并行的中性束注入传输模拟算法,该算法通过并行任务分配策略优化了粒子轨迹模拟和束流沉积计算的并行效率,实现了跨节点通信与线程级并行的协同加速。实验结果表明:相比于原始串行程序、纯MPI并行方法及纯OpenMP方法,基于MPI+OpenMP的混合并行算法获得了更高的加速比,且在多节点上展现良好的可扩展性。该模拟方法高效地为实际中性束注入实验提供了参考标准,为中性束组件优化设计提供了参考价值。 展开更多
关键词 中性束传输 并行计算 mpi OPENMP
在线阅读 下载PDF
基于最优路径相似度度量的MPI程序路径覆盖测试方法
2
作者 袁剑锋 刘佳 郭建卫 《电脑与信息技术》 2025年第1期41-47,共7页
针对消息传递接口(Message Passing Interface,MPI)程序中,路径覆盖路径相似度度量方法在测试数据生成方面效率较低的问题,提出一种高效且高可靠性的测试路径度量方法。该方法首先基于不同的相似性度量方法,度量MPI程序路径间的相似度,... 针对消息传递接口(Message Passing Interface,MPI)程序中,路径覆盖路径相似度度量方法在测试数据生成方面效率较低的问题,提出一种高效且高可靠性的测试路径度量方法。该方法首先基于不同的相似性度量方法,度量MPI程序路径间的相似度,并运用协同进化算法产生测试数据;然后,对比在不同的相似性度量方法下,产生覆盖MPI程序目标路径测试数据的有效性和效率;最后,确定对应最高有效性和效率的相似度度量方法为最优路径相似度公式。所提出的验证方法被应用于7个并行程序上,实验结果表明,所提方法在生成测试数据方面具有最高的效率和有效性。 展开更多
关键词 相似度度量方法 测试数据生成 路径覆盖测试 mpi程序 协同进化算法
在线阅读 下载PDF
基于“天河二号”聚合通信卸载特性的MPI_Barrier优化
3
作者 朱琦 戴艺 +5 位作者 彭晋韬 谢旻 梁崇山 刘鹏 杨博 刘杰 《计算机工程与科学》 北大核心 2025年第3期400-411,共12页
Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限... Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限制,针对“天河二号”定制网络TH-Express聚合通信卸载特性,提出了基于GLEX NIC的Barrier加速和共享内存标志位重排列2种优化技术,有效减少了节点间同步开销,提高了节点内基于共享内存的同步效率。基于上述优化方法,重新设计了MPI_Barrier算法,并将其集成到MPI通信库中,并在国家超级计算长沙中心通过运行微基准测试程序和实际应用程序对所提优化方法进行性能测试,规模达到7168个节点。实验结果表明,优化后的MPI_Barrier集合操作获得了1.3~14.5倍的加速,并在应用级真实负载评测中,性能提升高达54%。 展开更多
关键词 mpi BARRIER 大规模并行应用 NIC聚合通信卸载
在线阅读 下载PDF
基于MPI的异构算力资源融合调度平台 被引量:1
4
作者 叶宁 付康 +3 位作者 胡少文 龚一峰 王康 杨宇仙 《计算机与现代化》 2025年第12期38-45,共8页
针对高性能计算中心尤其是中小规模计算中心因异构算力资源分散化导致无法承担大规模计算作业问题,设计并实现一种异构算力资源融合调度平台,实现对X86、ARM等异构算力资源的统一纳管与协同计算。平台采用分层融合调度架构,利用集群管... 针对高性能计算中心尤其是中小规模计算中心因异构算力资源分散化导致无法承担大规模计算作业问题,设计并实现一种异构算力资源融合调度平台,实现对X86、ARM等异构算力资源的统一纳管与协同计算。平台采用分层融合调度架构,利用集群管理服务(CMS)与作业管理器(JMC)动态监控资源状态,借助作业调度器(JS)实现计算任务在异构计算节点间的协同并行计算。通过主从式JMC进程协同以及消息传递接口MPI(Message Passing Interface)规约机制,实现物理机层面的跨架构数据同步,首次实现物理机层面单一作业在异构计算节点并行计算。针对异构集群性能不均衡引发的长尾延迟效应及产生的同步开销问题,本文提出时限约束最小资源配置算法(DCMR),在保证作业完成时限的前提下,最小化计算资源投入。测试结果表明,平台在异构环境下计算性能几乎无损失。DCMR算法有效提升了异构计算资源的利用效率,为应对异构计算环境提供了可靠的系统解决方案。 展开更多
关键词 异构算力 资源调度 mpi 物理机 中小规模计算中心
在线阅读 下载PDF
电大涂覆目标SBR算法与MPI并行加速技术
5
作者 吴扬 王思凡 +5 位作者 申子昂 贾浩文 祝强强 徐若锋 郭卿超 赵雷 《电波科学学报》 北大核心 2025年第3期407-414,共8页
为满足涂覆雷达吸波材料(radar absorbing material,RAM)的复杂目标电磁散射快速计算需求,提出了一种基于弹跳射线(shooting and bouncing ray,SBR)的高效计算方法。该方法利用广义传播矩阵法理论推导了金属衬底多层介质的反射系数,并... 为满足涂覆雷达吸波材料(radar absorbing material,RAM)的复杂目标电磁散射快速计算需求,提出了一种基于弹跳射线(shooting and bouncing ray,SBR)的高效计算方法。该方法利用广义传播矩阵法理论推导了金属衬底多层介质的反射系数,并将其与SBR法耦合,精确计算了多层介质涂覆目标的雷达散射截面(radar cross section,RCS);为进一步提高计算效率,采用基于CPU平台的MPI并行加速技术,实现了SBR算法的高效并行。数值结果表明:所计算的二面角反射器模型和舰船模型RCS结果与商业软件FEKO结果之间吻合良好,其中二面角反射器的均方根误差小于3 dBsm;针对电大涂覆飞行器目标,各计算进程的并行效率均达到80%以上。该方法有效解决了电大涂覆目标电磁散射计算的精度和速度,为电大复杂目标隐身性能的评估计算提供了高效的解决方案。 展开更多
关键词 弹跳射线(SBR)法 广义传播矩阵法 mpi并行 雷达散射截面(RCS) 雷达吸波材料(RAM)
在线阅读 下载PDF
低频辐射环境下多导线电磁耦合计算新方法
6
作者 叶志红 翟宇凡 《微波学报》 北大核心 2026年第1期60-67,共8页
鉴于低频辐射持续时间很长而多导体传输线结构精细,场线耦合时域计算效率极低,同时缺乏高效的场线耦合频域模型与算法。本文将频域有限差分法(FDFD)与传输线方程和矩量法(MoM)相结合,研究了一种新型的场线耦合频域算法,实现屏蔽腔体环... 鉴于低频辐射持续时间很长而多导体传输线结构精细,场线耦合时域计算效率极低,同时缺乏高效的场线耦合频域模型与算法。本文将频域有限差分法(FDFD)与传输线方程和矩量法(MoM)相结合,研究了一种新型的场线耦合频域算法,实现屏蔽腔体环境下多导体传输线低频辐射干扰的准确快速计算。首先,采用传输线方程构建多导体传输线的低频辐射耦合模型,通过FDFD方法进行求解,推导建立新型的FDFD-TL矩阵方程。然后,使用MoM准确快速计算多导体传输线沿线的切向电场,获取FDFD-TL矩阵方程的等效电压源项。最后,结合复共轭梯度法与MPI并行技术,快速求解FDFD-TL矩阵方程,获得多导体传输线沿线及端接负载电流响应。通过相应计算实例的数值模拟,与MoM全波仿真结果从精度和计算耗时两方面进行对比,充分验证了该方法的计算精度与效率。 展开更多
关键词 低频辐射 多导体传输线耦合 矩量法 FDFD-TL矩阵方程 mpi并行的复共轭梯度法
原文传递
碳市场下考虑混合博弈的多园区综合能源系统优化调度
7
作者 于静梅 王兴隆 《电力系统及其自动化学报》 北大核心 2026年第3期89-98,共10页
为实现多园区综合能源系统低碳经济优化调度目标,提出一种综合考虑系统供能侧与负荷侧、碳激励及混合博弈的多园区综合能源系统优化调度模型。首先,考虑阶梯碳交易机制,供能侧激励不同园区综合能源系统在产能中减少碳排放量;其次,用户... 为实现多园区综合能源系统低碳经济优化调度目标,提出一种综合考虑系统供能侧与负荷侧、碳激励及混合博弈的多园区综合能源系统优化调度模型。首先,考虑阶梯碳交易机制,供能侧激励不同园区综合能源系统在产能中减少碳排放量;其次,用户侧引入激励型需求响应策略,鼓励用户根据供能侧对不同负荷激励价格调整用能行为;然后,多园区综合能源系统进行电能交互供应模式,构建园区综合能源系统内供能侧与用户侧主从博弈模型,分别描述多个园区综合能源系统的供能侧与用户侧能源互动关系;同时,构建园区综合能源系统用户侧负荷及储能设备合作博弈模型,即一种综合性多园区综合能源系统优化调度混合博弈模型;最后,通过多个算例场景,验证所提方法的有效性,实现多园区综合能源系统低碳经济运行。 展开更多
关键词 多园区综合能源系统 碳激励 混合博弈 阶梯碳交易机制 激励型需求响应策略 激励价格
在线阅读 下载PDF
基于SMP集群的MPI+OpenMP混合编程模型研究 被引量:19
8
作者 潘卫 陈燎原 +3 位作者 张锦华 李永革 潘莉 夏凡 《计算机应用研究》 CSCD 北大核心 2009年第12期4592-4594,共3页
讨论了MPI+OpenMP混合编程模型的特点及其实现方法。建立了对拉普拉斯偏微分方程求解的混合并行算法,并在HL-2A高性能计算系统上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。
关键词 对称式多处理器集群 消息传递界面 OPENMP mpi+OPENMP HL-2A高性能计算系统
在线阅读 下载PDF
基于MPI的二维大地电磁正演的并行计算 被引量:11
9
作者 李焱 胡祥云 +2 位作者 吴桂桔 叶益信 廖国忠 《地震地质》 EI CSCD 北大核心 2010年第3期392-401,共10页
大地电磁二维正演对每一个频率分别进行计算,各频率对应的电磁场值间相互独立,根据这一特点可以将程序按频率划分粒度,将每个频点计算分配到各个进程同时进行计算,并行执行。文中给出了大地电磁二维有限元正演的并行算法,它结合了MPI的... 大地电磁二维正演对每一个频率分别进行计算,各频率对应的电磁场值间相互独立,根据这一特点可以将程序按频率划分粒度,将每个频点计算分配到各个进程同时进行计算,并行执行。文中给出了大地电磁二维有限元正演的并行算法,它结合了MPI的优点,采用主从并行模式、分频并行计算的并行方案来执行。为了检验编写的并行程序,对设计的2个模型进行试算,并与串行程序对比验证了该算法的可行性、正确性,为二维反演、三维正反演的并行计算提供了研究基础。 展开更多
关键词 大地电磁 mpi 二维 有限元 正演
在线阅读 下载PDF
基于线程的MPI通信加速器技术研究 被引量:12
10
作者 刘志强 宋君强 +1 位作者 卢风顺 赵娟 《计算机学报》 EI CSCD 北大核心 2011年第1期154-164,共11页
为了针对多核系统构建更高效的MPI支撑环境,文中提出了一种基于线程的MPI加速器,称作MPIActor.MPIActor是一种用于协助传统MPI库的透明中间件,用户可以在编译期选择是否在单线程MPI程序中采用该中间件.加入MPIActor后,每个节点内的MPI... 为了针对多核系统构建更高效的MPI支撑环境,文中提出了一种基于线程的MPI加速器,称作MPIActor.MPIActor是一种用于协助传统MPI库的透明中间件,用户可以在编译期选择是否在单线程MPI程序中采用该中间件.加入MPIActor后,每个节点内的MPI进程都被映射成同一进程中的多个线程,从而节点内的通信可通过轻量级的线程通信机制实现.作者给出了MPIActor的基本设计,详细阐述了其工作机制、通信体系结构及关键技术,并在真实系统上分别针对MVAPICH2和OpenMPI并行环境利用OSU LATENCY基准测试进行了性能评测.实验结果表明在两种MPI环境上进行节点内8 KB^4 MB数据通信时MPIActor都能使通信性能平均提高一倍左右. 展开更多
关键词 mpi软件结构 线程mpi mpi加速器 mpiActor
在线阅读 下载PDF
基于MPI的遥感影像高效能并行处理方法研究 被引量:16
11
作者 沈占锋 骆剑承 +1 位作者 陈秋晓 盛昊 《中国图象图形学报》 CSCD 北大核心 2007年第12期2132-2136,共5页
采用基于不同尺度下的面向特征基元的影像分析方法对高分辨率遥感影像进行基于MPI的处理,即在对常规的影像数据划分方法进行总结分析的基础上,提出了基于特定环境下的非均匀数据划分策略;在进行基于影像数据库的MPI并行处理时,提出了一... 采用基于不同尺度下的面向特征基元的影像分析方法对高分辨率遥感影像进行基于MPI的处理,即在对常规的影像数据划分方法进行总结分析的基础上,提出了基于特定环境下的非均匀数据划分策略;在进行基于影像数据库的MPI并行处理时,提出了一种新的数据流分配方法。处理结果表明,这两种方法均能够在一定环境下取得比常规方法更高的效率。 展开更多
关键词 mpi 并行计算 信息提取 尺度 数据划分
在线阅读 下载PDF
利用最小二乘直接法反演卫星重力场模型的MPI并行算法 被引量:11
12
作者 周浩 罗志才 +1 位作者 钟波 陆飚 《测绘学报》 EI CSCD 北大核心 2015年第8期833-839,857,共8页
针对海量卫星重力数据反演高阶次地球重力场模型的密集型计算任务与高内存耗用问题,基于MPI实现了最小二乘直接法恢复高阶次位系数的并行算法。引入并行读写、分块存储与分块计算等方式完成了设计矩阵的构建、法方程的形成与求解等密集... 针对海量卫星重力数据反演高阶次地球重力场模型的密集型计算任务与高内存耗用问题,基于MPI实现了最小二乘直接法恢复高阶次位系数的并行算法。引入并行读写、分块存储与分块计算等方式完成了设计矩阵的构建、法方程的形成与求解等密集型计算任务的并行算法,数值计算结果表明三者的并行相对效率峰值可分别达到95%、68%、63%。利用GOCE轨道跟踪和径向扰动重力梯度数据(共518 400个历元)分别反演了120、240阶次地球重力场模型,计算时间仅为40min、7h,内存耗用峰值仅为290MB、1.57GB;采用与GOCE同等噪声水平的观测数据恢复的重力场模型精度与GOCE已发布模型的解算精度相一致,联合GRACE和GOCE的解算模型能够实现二者独立信息的频谱互补,表明本文方法可高效稳定地恢复高阶次地球重力场模型。 展开更多
关键词 mpi 并行算法 卫星重力场模型 Gauss-Jordan算法 GOCE
在线阅读 下载PDF
非结构CFD软件MPI+OpenMP混合并行及超大规模非定常并行计算的应用 被引量:13
13
作者 王年华 常兴华 +1 位作者 赵钟 张来平 《航空学报》 EI CAS CSCD 北大核心 2020年第10期185-199,共15页
常规工程应用中,非定常数值模拟(如多体分离)的计算量十分巨大,如果为了达到更高的计算精度,加密网格或者采用高精度方法将会使得计算量进一步增大,导致非定常数值模拟在CFD工程应用中成为十分耗时和昂贵的工作,因此,提高非定常数值模... 常规工程应用中,非定常数值模拟(如多体分离)的计算量十分巨大,如果为了达到更高的计算精度,加密网格或者采用高精度方法将会使得计算量进一步增大,导致非定常数值模拟在CFD工程应用中成为十分耗时和昂贵的工作,因此,提高非定常数值模拟的可扩展性和计算效率十分必要。为充分发挥既有分布内存又有共享内存的多核处理器的性能和效率优势,对作者团队开发的非结构网格二阶精度有限体积CFD软件(HyperFLOW)进行了混合并行改造,在计算节点间采用MPI消息传递机制,在节点内采用OpenMP共享内存的MPI+OpenMP混合并行策略。首先分别实现了两种粒度(粗粒度和细粒度)的混合并行,并基于国产in-house集群采用CRM标模(约4000万网格单元)定常湍流算例对两种混合并行模式进行了测试和比较。结果表明,粗粒度在进程数和分区数较少的小规模并行时具有效率优势,16线程时效率较高;而细粒度混合并行在大规模并行计算时具有优势,8线程时效率较高。其次,验证了混合并行在非定常计算情况下的可扩展性,采用机翼外挂物投放标模算例,分别生成3.6亿和28.8亿非结构重叠网格,采用对等的(P2P)网格读入模式和优化的重叠网格隐式装配策略,网格读入和重叠网格装配耗时仅需数十秒;采用3.6亿网格,完成了非定常状态效率测试及非定常分离过程的湍流流场计算,在in-house集群上12288核并行效率达到90%(以768核为基准),在天河2号上12288核并行效率达到70%(以384核为基准),数值模拟结果与试验结果符合良好。最后,在inhouse集群上采用28.8亿非结构重叠网格进行了4.9万核的并行效率测试,结果显示,4.9万核并行效率达到55.3%(以4096核为基准)。 展开更多
关键词 mpi+OpenMP混合并行 并行效率 计算流体力学 重叠网格 非定常计算
原文传递
基于集群MPI的图层级多边形并行合并算法 被引量:9
14
作者 范俊甫 马廷 +3 位作者 周成虎 季民 周玉科 许涛 《地球信息科学学报》 CSCD 北大核心 2014年第4期517-523,共7页
在集群环境下,基于MPI并行编程模型和OGC简单要素规范进行并行多边形合并时,需要处理叠加图层间要素的"多对多"映射关系,由于空间上相邻的多边形在要素序列上并不一定连续,导致无法按要素序列为子节点分配任务,给并行任务映... 在集群环境下,基于MPI并行编程模型和OGC简单要素规范进行并行多边形合并时,需要处理叠加图层间要素的"多对多"映射关系,由于空间上相邻的多边形在要素序列上并不一定连续,导致无法按要素序列为子节点分配任务,给并行任务映射带来了困难。本文以集群环境下的并行多边形合并算法为研究对象,通过比较叠加分析中两种多边形映射关系对算法并行化带来的影响,基于R树空间索引、MySQL精确空间查询,以及MPI通信机制,提出了6种不同的并行任务映射策略;通过实验分析和比较了6种策略的优劣。结果显示:基于R树预筛选的直接合并策略,在各算法中具有最高的串行计算效率和优秀的并行性能表现。虽然MySQL精确空间查询的预筛选过程较为耗时,但可有效地过滤掉不真正相交的多边形,从而提高合并操作的效率。因此,在集群MPI环境下,基于R树和MySQL精确空间查询的预筛选策略是解决并行任务映射难题,实现图层级多边形并行合并算法的有效途径。 展开更多
关键词 多边形合并 预筛选 任务映射 并行计算 mpi通信
原文传递
一种新的MPI Allgather算法及其在万亿次机群系统上的实现与性能分析 被引量:9
15
作者 陈靖 张云泉 +1 位作者 张林波 袁伟 《计算机学报》 EI CSCD 北大核心 2006年第5期808-814,共7页
给出一个新的MPIAllgather算法———邻居交换算法(neighborexchange).提出的平均逻辑通信距离的概念和计算公式,可以有效地衡量通信的局部性.通过分析,发现在4种MPIAllgather算法中,邻居交换和环算法均具有最优的通信局部性.在万亿次... 给出一个新的MPIAllgather算法———邻居交换算法(neighborexchange).提出的平均逻辑通信距离的概念和计算公式,可以有效地衡量通信的局部性.通过分析,发现在4种MPIAllgather算法中,邻居交换和环算法均具有最优的通信局部性.在万亿次机群深腾6800和曙光4000A上对4个MPIAllgather算法进行的性能测试和分析结果表明,邻居交换算法的长消息通信性能最优,中长消息通信性能不稳定,短消息通信性能次于递归倍增和Bruck算法. 展开更多
关键词 mpi Allgather算法 集合通信 性能评测 机群
在线阅读 下载PDF
一种支持多种访存技术的CBEA片上多核MPI并行编程模型 被引量:6
16
作者 冯国富 董小社 +2 位作者 胡冰 王旭昊 王恩东 《计算机学报》 EI CSCD 北大核心 2008年第11期1965-1974,共10页
现有的CBEA(Cell Broadband Engine Architecture)编程模型多侧重于支持类似于流处理的“批量访存”(Bulk Data Transfer)应用,传统非规则访存应用性能较低.文中基于Cell架构提出了一种同时支持“批量访存”与非规则访存应用的MPI... 现有的CBEA(Cell Broadband Engine Architecture)编程模型多侧重于支持类似于流处理的“批量访存”(Bulk Data Transfer)应用,传统非规则访存应用性能较低.文中基于Cell架构提出了一种同时支持“批量访存”与非规则访存应用的MPI并行编程模型,将通信分解在PPE(PowerPC Processing Element)上,拓宽模型的适用范围;在统一访存接口下,通过运行时访存剖分信息指导选择和优化访存以提高计算效率.实验结果表明,文中提出的编程模型支持多种访存模式并具有很好的并行加速比,可获得较同类相关技术30%-50%左右的性能提升. 展开更多
关键词 异构多核 CBE架构 并行编程模型 mpi 访存技术 剖分优化
在线阅读 下载PDF
基于MPI的一维大地电磁并行计算研究 被引量:9
17
作者 李焱 胡祥云 +3 位作者 金钢燮 吴桂桔 廖国忠 王程 《地球物理学进展》 CSCD 北大核心 2010年第5期1612-1616,共5页
在大地电磁中运用并行处理技术来减少计算时间,提高运算效率.结合一维广义逆矩阵法反演的计算特点,详细分析了串行程序并行化方法,主要采用主从并行模式、分频并行计算的并行方案.在Linux系统上使用Fortran和MPICH2相结合的开发工具编... 在大地电磁中运用并行处理技术来减少计算时间,提高运算效率.结合一维广义逆矩阵法反演的计算特点,详细分析了串行程序并行化方法,主要采用主从并行模式、分频并行计算的并行方案.在Linux系统上使用Fortran和MPICH2相结合的开发工具编写了并行程序,通过理论模型和实测数据对实现的并行程序进行试算,并与串行程序对比验证了该算法的可行性、正确性,为二维、三维的正反演并行计算提供了研究基础. 展开更多
关键词 大地电磁 mpi 并行计算 一维
在线阅读 下载PDF
大规模MPI并行计算的可扩展三模冗余容错机制 被引量:13
18
作者 王之元 杨学军 周云 《软件学报》 EI CSCD 北大核心 2012年第4期1022-1035,共14页
随着系统规模的扩大,并行计算的性能不断提高,但可靠性却也在不断下降,因此需要采用某种容错机制来容忍或恢复硬件故障和数据错误.目前常用的容错机制Checkpoint/Restart和多模冗余均引入了额外的开销,这些开销均在某种程度上制约了并... 随着系统规模的扩大,并行计算的性能不断提高,但可靠性却也在不断下降,因此需要采用某种容错机制来容忍或恢复硬件故障和数据错误.目前常用的容错机制Checkpoint/Restart和多模冗余均引入了额外的开销,这些开销均在某种程度上制约了并行计算的可扩展性.因此,在高性能计算需求不断增长的今天,可扩展容错机制的设计显得尤为迫切和重要.以三模冗余(triple modular redundancy,简称TMR)为典型案例,描述了传统TMR在大规模MPI并行计算上的实现方法,分析了该机制所面临的实际问题,进而指出传统TMR制约了并行计算的扩展.根据该技术所面临的问题,设计了可扩展三模冗余(scalable triple modular redundancy,简称STMR),并进一步验证了其有效性和可扩展性.该机制不仅能够处理Checkpoint/Restart针对的fail-stop故障,还能够解决绝大部分硬件不能直接感知的数据错误.最后,借用BlueGene/L的系统参数进行模拟,预测当系统规模增大时,在分别采用TMR和STMR的情况下并行计算可扩展性的变化,结果进一步验证了STMR是可扩展的容错机制. 展开更多
关键词 容错机制 可扩展性 三模冗余 大规模并行计算 mpi
在线阅读 下载PDF
基于MPI的塑件浇口优化设计 被引量:13
19
作者 范云霄 武迎迎 +1 位作者 赵国强 王方凯 《模具工业》 北大核心 2006年第12期53-56,共4页
针对浇口在塑料制品注射成型过程中的重要地位,在注射模设计中利用专业模流分析软件MPI对塑件浇口进行了优化设计。以手机面板为实例,介绍了MPI对其浇口位置和数量进行计算机模拟分析的过程,优化了模具浇口数量和位置,从而获得高预测质... 针对浇口在塑料制品注射成型过程中的重要地位,在注射模设计中利用专业模流分析软件MPI对塑件浇口进行了优化设计。以手机面板为实例,介绍了MPI对其浇口位置和数量进行计算机模拟分析的过程,优化了模具浇口数量和位置,从而获得高预测质量的产品,降低了生产成本,提高了模具企业的市场竞争力。 展开更多
关键词 浇口位置 PRO/E mpi 优化设计
在线阅读 下载PDF
基于MPI+OpenMP混合编程模型的城市路网最短路径并行算法 被引量:11
20
作者 杨庆芳 刘冬 杨兆升 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第6期1581-1584,共4页
针对城市路网最短路径求解计算量庞大、实时性要求高的问题,提出了用Floyd算法为核心的MPI+OpenMP混合编程模型来解决这个问题。MPI+OpenMP混合编程提供结点内和结点间的两级并行处理,能充分利用共享存储模型和消息传递模型的优点,有效... 针对城市路网最短路径求解计算量庞大、实时性要求高的问题,提出了用Floyd算法为核心的MPI+OpenMP混合编程模型来解决这个问题。MPI+OpenMP混合编程提供结点内和结点间的两级并行处理,能充分利用共享存储模型和消息传递模型的优点,有效改善系统性能,提高系统计算速度。经由长春市路网验证可知,混合模型比MPI模型具有更好的加速比和运算效率,并且随着计算节点个数的增加,加速比提高幅度更大,表明MPI+OpenMP混合模型有着更好的可扩展性。 展开更多
关键词 交通运输系统工程 消息传递接口 mpi+OpenMP混合模型 最短路径 FLOYD算法
在线阅读 下载PDF
上一页 1 2 91 下一页 到第
使用帮助 返回顶部