期刊文献+
共找到1,796篇文章
< 1 2 90 >
每页显示 20 50 100
基于线程的MPI通信加速器技术研究 被引量:12
1
作者 刘志强 宋君强 +1 位作者 卢风顺 赵娟 《计算机学报》 EI CSCD 北大核心 2011年第1期154-164,共11页
为了针对多核系统构建更高效的MPI支撑环境,文中提出了一种基于线程的MPI加速器,称作MPIActor.MPIActor是一种用于协助传统MPI库的透明中间件,用户可以在编译期选择是否在单线程MPI程序中采用该中间件.加入MPIActor后,每个节点内的MPI... 为了针对多核系统构建更高效的MPI支撑环境,文中提出了一种基于线程的MPI加速器,称作MPIActor.MPIActor是一种用于协助传统MPI库的透明中间件,用户可以在编译期选择是否在单线程MPI程序中采用该中间件.加入MPIActor后,每个节点内的MPI进程都被映射成同一进程中的多个线程,从而节点内的通信可通过轻量级的线程通信机制实现.作者给出了MPIActor的基本设计,详细阐述了其工作机制、通信体系结构及关键技术,并在真实系统上分别针对MVAPICH2和OpenMPI并行环境利用OSU LATENCY基准测试进行了性能评测.实验结果表明在两种MPI环境上进行节点内8 KB^4 MB数据通信时MPIActor都能使通信性能平均提高一倍左右. 展开更多
关键词 mpi软件结构 线程mpi mpi加速器 mpiActor
在线阅读 下载PDF
多核机群下MPI程序优化技术的研究 被引量:2
2
作者 王洁 衷璐洁 曾宇 《计算机科学》 CSCD 北大核心 2011年第10期281-284,共4页
多核处理器的新特性使多核机群的存储层次更加复杂,同时也给MPI程序带来了新的优化空间。国内外学者提出了许多多核机群下MPI程序的优化方法和技术。测试了3个不同多核机群的通信性能,并分别在Intel与AMD多核机群下实验评估了几种具有... 多核处理器的新特性使多核机群的存储层次更加复杂,同时也给MPI程序带来了新的优化空间。国内外学者提出了许多多核机群下MPI程序的优化方法和技术。测试了3个不同多核机群的通信性能,并分别在Intel与AMD多核机群下实验评估了几种具有普遍意义的优化技术:混合MPI/OpenMP、优化MPI运行时参数以及优化MPI进程摆放,同时对实验结果和优化性能进行了分析。 展开更多
关键词 多核机群 存储层次化 mpi程序优化 混合mpi/OpenMP mpi运行时参数 mpi进程摆放
在线阅读 下载PDF
MPI语言绑定:MPI-Delphi,MPI-Java与MPI-Ruby 被引量:4
3
作者 魏兵海 《计算机科学》 CSCD 北大核心 2004年第8期185-189,共5页
MPI(消息传递接口)是最重要的主流并行计算模式之一,它既能应用于当今的分布式环境,也可用于未来的网格环境。本文对以下三种 API 语言绑定作了综合性分析:MPI-Delphi,MPI-Java 和 MPI-Ruby,并探讨了其体系架构、实现机制及相关的技术... MPI(消息传递接口)是最重要的主流并行计算模式之一,它既能应用于当今的分布式环境,也可用于未来的网格环境。本文对以下三种 API 语言绑定作了综合性分析:MPI-Delphi,MPI-Java 和 MPI-Ruby,并探讨了其体系架构、实现机制及相关的技术特征。MPI-Delphi 基于 DLL(动态语言连接)模式实现 Delphi 语言到 MPI 库的绑定。在MPI-Java 绑定实现时,JVM(Java 虚拟机)、JNI(Java 本地接接口)、对象串行化范型和 Java 新 I/O 库 Java.nio 都是用作 MPI 性能优化的关键技术。MPI-Ruby 能够提供给用户最易使用和最强大的接口。本文还对一些相关的绑定机制进行了介绍和分析。 展开更多
关键词 mpi 语言绑定 mpi-Delphi mpi-Java mpi-Ruby 消息传递接口
在线阅读 下载PDF
基于最优路径相似度度量的MPI程序路径覆盖测试方法
4
作者 袁剑锋 刘佳 郭建卫 《电脑与信息技术》 2025年第1期41-47,共7页
针对消息传递接口(Message Passing Interface,MPI)程序中,路径覆盖路径相似度度量方法在测试数据生成方面效率较低的问题,提出一种高效且高可靠性的测试路径度量方法。该方法首先基于不同的相似性度量方法,度量MPI程序路径间的相似度,... 针对消息传递接口(Message Passing Interface,MPI)程序中,路径覆盖路径相似度度量方法在测试数据生成方面效率较低的问题,提出一种高效且高可靠性的测试路径度量方法。该方法首先基于不同的相似性度量方法,度量MPI程序路径间的相似度,并运用协同进化算法产生测试数据;然后,对比在不同的相似性度量方法下,产生覆盖MPI程序目标路径测试数据的有效性和效率;最后,确定对应最高有效性和效率的相似度度量方法为最优路径相似度公式。所提出的验证方法被应用于7个并行程序上,实验结果表明,所提方法在生成测试数据方面具有最高的效率和有效性。 展开更多
关键词 相似度度量方法 测试数据生成 路径覆盖测试 mpi程序 协同进化算法
在线阅读 下载PDF
基于“天河二号”聚合通信卸载特性的MPI_Barrier优化
5
作者 朱琦 戴艺 +5 位作者 彭晋韬 谢旻 梁崇山 刘鹏 杨博 刘杰 《计算机工程与科学》 北大核心 2025年第3期400-411,共12页
Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限... Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限制,针对“天河二号”定制网络TH-Express聚合通信卸载特性,提出了基于GLEX NIC的Barrier加速和共享内存标志位重排列2种优化技术,有效减少了节点间同步开销,提高了节点内基于共享内存的同步效率。基于上述优化方法,重新设计了MPI_Barrier算法,并将其集成到MPI通信库中,并在国家超级计算长沙中心通过运行微基准测试程序和实际应用程序对所提优化方法进行性能测试,规模达到7168个节点。实验结果表明,优化后的MPI_Barrier集合操作获得了1.3~14.5倍的加速,并在应用级真实负载评测中,性能提升高达54%。 展开更多
关键词 mpi BARRIER 大规模并行应用 NIC聚合通信卸载
在线阅读 下载PDF
一种Nehalem平台上的MPI多级分段归约算法
6
作者 邹金安 刘志强 廖蔚 《小型微型计算机系统》 CSCD 北大核心 2012年第4期733-738,共6页
基于线程MPI环境提出一种适用于Nehalem平台长消息归约的多级分段归约算法(HSRA).HSRA考虑了Nehalem系统的体系结构特点,分处理器内归约和处理器外归约两个步骤实施节点内归约通信,在均匀分布计算负载的前提下仅需要较少的远端内存访问... 基于线程MPI环境提出一种适用于Nehalem平台长消息归约的多级分段归约算法(HSRA).HSRA考虑了Nehalem系统的体系结构特点,分处理器内归约和处理器外归约两个步骤实施节点内归约通信,在均匀分布计算负载的前提下仅需要较少的远端内存访问.首先在MPIActor的归约算法框架中设计、实现了HSRA算法,从访存角度分析了HSRA算法的开销,然后与单级分段和已有的另外三种节点内基于共享内存的归约算法进行比较;最后在真实系统上通过IMB(Intel MPI Benchmark)验证算法,实验结果表明,该算法是一种适用于在Nehalem系统中处理长消息节点内归约的高效算法. 展开更多
关键词 多级分段归约算法 mpi HSRA NEHALEM mpi归约 mpi全归约
在线阅读 下载PDF
电大涂覆目标SBR算法与MPI并行加速技术
7
作者 吴扬 王思凡 +5 位作者 申子昂 贾浩文 祝强强 徐若锋 郭卿超 赵雷 《电波科学学报》 北大核心 2025年第3期407-414,共8页
为满足涂覆雷达吸波材料(radar absorbing material,RAM)的复杂目标电磁散射快速计算需求,提出了一种基于弹跳射线(shooting and bouncing ray,SBR)的高效计算方法。该方法利用广义传播矩阵法理论推导了金属衬底多层介质的反射系数,并... 为满足涂覆雷达吸波材料(radar absorbing material,RAM)的复杂目标电磁散射快速计算需求,提出了一种基于弹跳射线(shooting and bouncing ray,SBR)的高效计算方法。该方法利用广义传播矩阵法理论推导了金属衬底多层介质的反射系数,并将其与SBR法耦合,精确计算了多层介质涂覆目标的雷达散射截面(radar cross section,RCS);为进一步提高计算效率,采用基于CPU平台的MPI并行加速技术,实现了SBR算法的高效并行。数值结果表明:所计算的二面角反射器模型和舰船模型RCS结果与商业软件FEKO结果之间吻合良好,其中二面角反射器的均方根误差小于3 dBsm;针对电大涂覆飞行器目标,各计算进程的并行效率均达到80%以上。该方法有效解决了电大涂覆目标电磁散射计算的精度和速度,为电大复杂目标隐身性能的评估计算提供了高效的解决方案。 展开更多
关键词 弹跳射线(SBR)法 广义传播矩阵法 mpi并行 雷达散射截面(RCS) 雷达吸波材料(RAM)
在线阅读 下载PDF
非平衡进程到达模式下MPI广播的性能优化方法 被引量:4
8
作者 刘志强 宋君强 +1 位作者 卢风顺 徐芬 《软件学报》 EI CSCD 北大核心 2011年第10期2509-2522,共14页
为了提高非平衡进程到达(unbalanced process arrival,简称UPA)模式下MPI广播的性能,对UPA模式下的广播问题进行了理论分析,证明了在多核集群环境中通过节点内多个MPI进程的竞争可以有效减少UPA对MPI广播性能的影响,并在此基础上提出了... 为了提高非平衡进程到达(unbalanced process arrival,简称UPA)模式下MPI广播的性能,对UPA模式下的广播问题进行了理论分析,证明了在多核集群环境中通过节点内多个MPI进程的竞争可以有效减少UPA对MPI广播性能的影响,并在此基础上提出了一种新的优化方法,即竞争式流水化方法(competitive and pipelined method,简称CP).CP方法通过一种节点内进程竞争机制在广播过程中尽早启动节点间通信,经该方法优化的广播算法利用共享内存在节点内通信,利用由竞争机制产生的引导进程执行原算法在节点间通信.并且,该方法使节点间通信和节点内通信以流水方式重叠执行,能够有效利用集群系统各节点的多核优势,减少了MPI广播受UPA的影响,提高了性能.为了验证CP方法的有效性,基于此方法优化了3种典型的MPI广播算法,分别适用于不同消息长度的广播.在真实系统中,通过微基准测试和两个实际的应用程序对CP广播进行了性能评价,结果表明,该方法能够有效地提高传统广播算法在UPA模式下的性能.在应用程序的负载测试实验结果中,CP广播的性能较流水化广播的性能提高约16%,较MVAPICH21.2中广播的性能提高18%~24%. 展开更多
关键词 进程到达模式 mpi 集合通信 mpi_Bcast 竞争式流水化方法
在线阅读 下载PDF
MPI全互换通信的性能优化 被引量:2
9
作者 罗秋明 王梅 +1 位作者 雷海军 张红兵 《计算机工程与应用》 CSCD 北大核心 2006年第16期127-128,170,共3页
MPI全互换操作是集群计算机上进行仿真计算时常用的通信操作之一,用于各计算节点间交换上一步骤的中间计算结果。由于全互换通信的密集多对多通信容易产生接收端的阻塞从而增加通信延时,因此通过形成环状的多次规律且有序的通信过程来... MPI全互换操作是集群计算机上进行仿真计算时常用的通信操作之一,用于各计算节点间交换上一步骤的中间计算结果。由于全互换通信的密集多对多通信容易产生接收端的阻塞从而增加通信延时,因此通过形成环状的多次规律且有序的通信过程来优化全互换通信操作过程,在大数据量的全互换通信中可以获得明显的性能提升。 展开更多
关键词 集群计算 mpi mpiCH 全互换
在线阅读 下载PDF
MPI程序的Petri网模型及其动态性质(英文) 被引量:5
10
作者 崔焕庆 吴哲辉 《系统仿真学报》 EI CAS CSCD 北大核心 2006年第9期2455-2460,共6页
对并行程序进行验证以保证正确性是很重要的,但是由于并行程序比串行程序要复杂得多,因此有必要建立它们的模型。MPI是目前应用最广泛的基于消息传递的并行程序编程标准之一。基于MPI程序的特点,提出了MPI并行程序的Petri网模型——MPIN... 对并行程序进行验证以保证正确性是很重要的,但是由于并行程序比串行程序要复杂得多,因此有必要建立它们的模型。MPI是目前应用最广泛的基于消息传递的并行程序编程标准之一。基于MPI程序的特点,提出了MPI并行程序的Petri网模型——MPINet,给出了MPI函数的基本Petri网模型及对程序建模的基本步骤。定义了静态可执行的和并行正确的并行程序,并研究了MPINet的动态性质,包括安全性、可达性、可逆性以及活性。这些方法可以用于其他并行编程标准的分析。 展开更多
关键词 mpi PETRI网 mpiNet 动态性质
在线阅读 下载PDF
MPI+OpenMP环境下的二元合金三维相场模型的并行方法 被引量:2
11
作者 朱昶胜 邓新 +1 位作者 冯力 李浩 《兰州理工大学学报》 CAS 北大核心 2017年第4期16-22,共7页
针对二元合金三维相场模型模拟研究中存在的计算区域小、计算效率低,难以满足二元合金大规模模拟的需求,提出基于MPI+OpenMP混合编程模式的并行方法.在相同计算规模下对MPI和OpenMP并行技术的优缺点进行分析.在计算机集群环境下对MPI+Op... 针对二元合金三维相场模型模拟研究中存在的计算区域小、计算效率低,难以满足二元合金大规模模拟的需求,提出基于MPI+OpenMP混合编程模式的并行方法.在相同计算规模下对MPI和OpenMP并行技术的优缺点进行分析.在计算机集群环境下对MPI+OpenMP混合编程模式和纯MPI并行方法的并行效率进行对比和分析.结果证明:基于MPI+OpenMP混合编程模式可以有效地扩大二元合金三维相场模型的计算规模;在多核集群环境下,相对于纯MPI并行方法,MPI+OpenMP混合编程可以更加有效地利用多核集群的多层次结构,取得更高的加速比和计算效率. 展开更多
关键词 相场法 二元合金 mpi mpi+OPENMP
在线阅读 下载PDF
MPI及MPI的高效实现 被引量:4
12
作者 周恩强 赵军锁 杨学军 《计算机工程与科学》 CSCD 1999年第5期47-51,共5页
本文描述了MPI的基本概念及两个MPI实现软件LAM 和MPICH。MPICH是一个可移植的MPI实现,可容易地移植到其他MPP系统。我们在源码分析基础上, 结合实践经验,
关键词 mpi mpiCH LAM 并行计算机
在线阅读 下载PDF
基于MPI的异构算力资源融合调度平台
13
作者 叶宁 付康 +3 位作者 胡少文 龚一峰 王康 杨宇仙 《计算机与现代化》 2025年第12期38-45,共8页
针对高性能计算中心尤其是中小规模计算中心因异构算力资源分散化导致无法承担大规模计算作业问题,设计并实现一种异构算力资源融合调度平台,实现对X86、ARM等异构算力资源的统一纳管与协同计算。平台采用分层融合调度架构,利用集群管... 针对高性能计算中心尤其是中小规模计算中心因异构算力资源分散化导致无法承担大规模计算作业问题,设计并实现一种异构算力资源融合调度平台,实现对X86、ARM等异构算力资源的统一纳管与协同计算。平台采用分层融合调度架构,利用集群管理服务(CMS)与作业管理器(JMC)动态监控资源状态,借助作业调度器(JS)实现计算任务在异构计算节点间的协同并行计算。通过主从式JMC进程协同以及消息传递接口MPI(Message Passing Interface)规约机制,实现物理机层面的跨架构数据同步,首次实现物理机层面单一作业在异构计算节点并行计算。针对异构集群性能不均衡引发的长尾延迟效应及产生的同步开销问题,本文提出时限约束最小资源配置算法(DCMR),在保证作业完成时限的前提下,最小化计算资源投入。测试结果表明,平台在异构环境下计算性能几乎无损失。DCMR算法有效提升了异构计算资源的利用效率,为应对异构计算环境提供了可靠的系统解决方案。 展开更多
关键词 异构算力 资源调度 mpi 物理机 中小规模计算中心
在线阅读 下载PDF
MPI_ALLGATHER实现算法的改进与性能分析 被引量:2
14
作者 李占胜 毕会娟 +1 位作者 都志辉 焦青 《计算机工程与应用》 CSCD 北大核心 2007年第27期66-71,共6页
首先分析了影响MPI组通信性能的各方面因素,提出了一种衡量算法性能的模型。基于这种分析及模型,提出了一种将邻居交换和递归倍增两种算法结合的新的MPI_ALLGATHER实现算法。新的算法比邻居交换算法通信次数少,比递归倍增算法具有较好... 首先分析了影响MPI组通信性能的各方面因素,提出了一种衡量算法性能的模型。基于这种分析及模型,提出了一种将邻居交换和递归倍增两种算法结合的新的MPI_ALLGATHER实现算法。新的算法比邻居交换算法通信次数少,比递归倍增算法具有较好的通信局部性。通过在高性能机群系统中的测试,发现新算法在多种情况下比邻居交换算法具有更优的性能,在中等长度消息通信时具有最优的性能,在长消息通信时性能比递归倍增算法和Bruck算法的性能更优,且在长消息通信时多数情况下性能最优。 展开更多
关键词 并行编程 mpi 组通信 mpi_ALLGATHER算法
在线阅读 下载PDF
MPI+OpenMP混合并行编程模型应用研究 被引量:24
15
作者 冯云 周淑秋 《计算机系统应用》 2006年第2期86-89,共4页
多处理器结点集群在高性能计算市场上日趋流行,如何在多处理器上编写出高效的并行代码成为研究的热点。MPI+OpenMP为多处理器结点集群提供了一种有效的并行策略,结点内部共享内存空间编程模式适合 OpenMP并行,消息传递模型MPI被用在集... 多处理器结点集群在高性能计算市场上日趋流行,如何在多处理器上编写出高效的并行代码成为研究的热点。MPI+OpenMP为多处理器结点集群提供了一种有效的并行策略,结点内部共享内存空间编程模式适合 OpenMP并行,消息传递模型MPI被用在集群的结点与结点之间,这样就实现了并行的层次结构化。 展开更多
关键词 mpi OPENMP mpi+OPENMP
在线阅读 下载PDF
MPICH在桥梁结构分析软件中的应用 被引量:1
16
作者 朱运河 高宗余 +1 位作者 杨峻 张林 《桥梁建设》 EI CSCD 北大核心 2009年第2期83-86,共4页
分析桥梁结构软件的应用情况,介绍桥梁仿真计算中采用串行计算方式与并行计算方式的区别。着重介绍应用MPICH重构桥梁结构分析软件,使串行的桥梁结构分析软件在计算单元及节点的活载效应时具有并行计算的功能,并介绍并行化计算中处理器... 分析桥梁结构软件的应用情况,介绍桥梁仿真计算中采用串行计算方式与并行计算方式的区别。着重介绍应用MPICH重构桥梁结构分析软件,使串行的桥梁结构分析软件在计算单元及节点的活载效应时具有并行计算的功能,并介绍并行化计算中处理器任务的分配。最后简要介绍桥梁结构分析软件中常用到的MPI函数,以及并行化计算方法的实践应用情况。 展开更多
关键词 mpiCH 桥梁结构 软件 并行计算 mpi函数 应用
在线阅读 下载PDF
基于MPI和OpenMP混合编程的非负矩阵分解并行算法 被引量:8
17
作者 唐兵 Laurent BOBELIN 贺海武 《计算机科学》 CSCD 北大核心 2017年第3期51-54,共4页
非负矩阵分解(NMF)作为一种数据降维和特征提取的有效工具,已经在文本聚类、推荐系统等多个领域得到应用,但是其计算过程比较复杂。对此,提出一种基于MPI+OpenMP的混合层次化并行NMF方法,其充分利用基于MPI的消息传递模型和基于OpenMP... 非负矩阵分解(NMF)作为一种数据降维和特征提取的有效工具,已经在文本聚类、推荐系统等多个领域得到应用,但是其计算过程比较复杂。对此,提出一种基于MPI+OpenMP的混合层次化并行NMF方法,其充分利用基于MPI的消息传递模型和基于OpenMP的共享存储模型各自的优势,并基于多核节点集群进行测试。实验结果表明,所设计的并行NMF算法达到了较高的加速比,能有效处理高阶矩阵的非负分解,极大地提高了计算的效率。 展开更多
关键词 非负矩阵分解 并行算法 mpi Openmpi 可扩展
在线阅读 下载PDF
MPI系统中共享内存通信技术研究 被引量:1
18
作者 张洋 卢宇彤 蒋艳凰 《现代电子技术》 2010年第19期179-182,共4页
MPI是消息传递并行程序设计接口,目前已经成为主流的并行编程模式。多核处理系统的出现,使得高性能计算更加关注节点内的进程通信性能。介绍多种节点内通信协议,以及两种MPI实现(Open MPI和MPICH2)的结构,并对其中基于共享内存的消息传... MPI是消息传递并行程序设计接口,目前已经成为主流的并行编程模式。多核处理系统的出现,使得高性能计算更加关注节点内的进程通信性能。介绍多种节点内通信协议,以及两种MPI实现(Open MPI和MPICH2)的结构,并对其中基于共享内存的消息传递功能采用的通信协议进行了研究,最后对两者的点点通信性能测试结果进行了比较和分析同时提出了优化策略。 展开更多
关键词 Open mpi mpiCH2 多核 共享内存 SM nemesis
在线阅读 下载PDF
基于VC.NET平台和MPI并行程序设计探索 被引量:1
19
作者 许淳 刘兴平 田云娜 《延安大学学报(自然科学版)》 2008年第1期15-17,共3页
简要介绍了MPICH2在windows XP下的安装及其在VC.NET 2005下的配置方法,通过对一个二维数组中所有元素求和的实现,论述了基于VC.NET平台和MPI进行并行程序设计的方法和技巧。
关键词 mpi mpiCH VC.NET 并行程序设计
在线阅读 下载PDF
针对MPI全局操作的低功耗优化
20
作者 杨灿群 杨学军 董勇 《计算机工程与科学》 CSCD 北大核心 2009年第2期141-144,149,共5页
本文介绍了针对MPI全局操作的低功耗优化技术,主要包括MPI_Barrier、MPI_Reduce和MPI_Bcast。利用处理器的电压调节技术降低轻负载处理器的电压/频率,达到降低系统能量消耗的目的。在Intel Xeon处理器构建的Cluster系统上,对NPB3.2-MPI... 本文介绍了针对MPI全局操作的低功耗优化技术,主要包括MPI_Barrier、MPI_Reduce和MPI_Bcast。利用处理器的电压调节技术降低轻负载处理器的电压/频率,达到降低系统能量消耗的目的。在Intel Xeon处理器构建的Cluster系统上,对NPB3.2-MPI和MG3D程序进行了功耗测试。结果表明,对MPI全局操作进行功耗优化可获得明显的能量节约。 展开更多
关键词 mpi全局操作 Cluster系统 低功耗 NPB3.2-mpi
在线阅读 下载PDF
上一页 1 2 90 下一页 到第
使用帮助 返回顶部