期刊文献+
共找到7,239篇文章
< 1 2 250 >
每页显示 20 50 100
基于最优路径相似度度量的MPI程序路径覆盖测试方法
1
作者 袁剑锋 刘佳 郭建卫 《电脑与信息技术》 2025年第1期41-47,共7页
针对消息传递接口(Message Passing Interface,MPI)程序中,路径覆盖路径相似度度量方法在测试数据生成方面效率较低的问题,提出一种高效且高可靠性的测试路径度量方法。该方法首先基于不同的相似性度量方法,度量MPI程序路径间的相似度,... 针对消息传递接口(Message Passing Interface,MPI)程序中,路径覆盖路径相似度度量方法在测试数据生成方面效率较低的问题,提出一种高效且高可靠性的测试路径度量方法。该方法首先基于不同的相似性度量方法,度量MPI程序路径间的相似度,并运用协同进化算法产生测试数据;然后,对比在不同的相似性度量方法下,产生覆盖MPI程序目标路径测试数据的有效性和效率;最后,确定对应最高有效性和效率的相似度度量方法为最优路径相似度公式。所提出的验证方法被应用于7个并行程序上,实验结果表明,所提方法在生成测试数据方面具有最高的效率和有效性。 展开更多
关键词 相似度度量方法 测试数据生成 路径覆盖测试 mpi程序 协同进化算法
在线阅读 下载PDF
基于“天河二号”聚合通信卸载特性的MPI_Barrier优化
2
作者 朱琦 戴艺 +5 位作者 彭晋韬 谢旻 梁崇山 刘鹏 杨博 刘杰 《计算机工程与科学》 北大核心 2025年第3期400-411,共12页
Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限... Barrier作为消息传递接口MPI程序的基本操作,是确保程序正确执行的重要机制之一。目前已有的Barrier实现方案主要存在2个缺陷:首先,节点间同步存在大量冗余的数据路径传输开销;其次,节点内同步存在大量缓存失效的情况。为解决这些性能限制,针对“天河二号”定制网络TH-Express聚合通信卸载特性,提出了基于GLEX NIC的Barrier加速和共享内存标志位重排列2种优化技术,有效减少了节点间同步开销,提高了节点内基于共享内存的同步效率。基于上述优化方法,重新设计了MPI_Barrier算法,并将其集成到MPI通信库中,并在国家超级计算长沙中心通过运行微基准测试程序和实际应用程序对所提优化方法进行性能测试,规模达到7168个节点。实验结果表明,优化后的MPI_Barrier集合操作获得了1.3~14.5倍的加速,并在应用级真实负载评测中,性能提升高达54%。 展开更多
关键词 mpi BARRIER 大规模并行应用 NIC聚合通信卸载
在线阅读 下载PDF
电大涂覆目标SBR算法与MPI并行加速技术
3
作者 吴扬 王思凡 +5 位作者 申子昂 贾浩文 祝强强 徐若锋 郭卿超 赵雷 《电波科学学报》 北大核心 2025年第3期407-414,共8页
为满足涂覆雷达吸波材料(radar absorbing material,RAM)的复杂目标电磁散射快速计算需求,提出了一种基于弹跳射线(shooting and bouncing ray,SBR)的高效计算方法。该方法利用广义传播矩阵法理论推导了金属衬底多层介质的反射系数,并... 为满足涂覆雷达吸波材料(radar absorbing material,RAM)的复杂目标电磁散射快速计算需求,提出了一种基于弹跳射线(shooting and bouncing ray,SBR)的高效计算方法。该方法利用广义传播矩阵法理论推导了金属衬底多层介质的反射系数,并将其与SBR法耦合,精确计算了多层介质涂覆目标的雷达散射截面(radar cross section,RCS);为进一步提高计算效率,采用基于CPU平台的MPI并行加速技术,实现了SBR算法的高效并行。数值结果表明:所计算的二面角反射器模型和舰船模型RCS结果与商业软件FEKO结果之间吻合良好,其中二面角反射器的均方根误差小于3 dBsm;针对电大涂覆飞行器目标,各计算进程的并行效率均达到80%以上。该方法有效解决了电大涂覆目标电磁散射计算的精度和速度,为电大复杂目标隐身性能的评估计算提供了高效的解决方案。 展开更多
关键词 弹跳射线(SBR)法 广义传播矩阵法 mpi并行 雷达散射截面(RCS) 雷达吸波材料(RAM)
在线阅读 下载PDF
A near-infrared all-fiber mode monitor based on the mini-two-path Mach-Zehnder interferometer
4
作者 ZHU Xiao-Jun LIU Yu +5 位作者 WU Yue ZHUANG Hao-Ran SUN Dan SHI Yue-Chun CAO Juan YANG Yong-Jie 《红外与毫米波学报》 北大核心 2025年第3期352-357,共6页
A novel near-infrared all-fiber mode monitor based on a mini-two-path Mach-Zehnder interferometer(MTP-MZI)is proposed.The MTP-MZI mode monitor is created by fusing a section of(no-core fiber,NCF)and a(single-mode fibe... A novel near-infrared all-fiber mode monitor based on a mini-two-path Mach-Zehnder interferometer(MTP-MZI)is proposed.The MTP-MZI mode monitor is created by fusing a section of(no-core fiber,NCF)and a(single-mode fiber,SMF)together with an optical fiber fusion splicer,establishing two distinct centimeter-level optical transmission paths.Since the high-order modes in NCF transmit near-infrared light more sensitively to curvature-induced energy leakage than the fundamental mode in SMF,the near-infrared high-order mode light leaks out of NCF when the curvature changes,causing the MTP-MZI transmission spectrum to change.By ana⁃lyzing the relationship between the curvature,transmission spectrum,and spatial frequency spectrum,the modes involved in the interference can be studied,thereby revealing the mode transmission characteristics of near-infra⁃red light in optical fibers.In the verification experiments,higher-order modes were excited by inserting a novel hollow-core fiber(HCF)into the MTP-MZI.When the curvature of the MTP-MZI changes,the near-infrared light high-order mode introduced into the device leaks out,causing the transmission spectrum to return to its origi⁃nal state before bending and before the HCF was spliced.The experimental results demonstrate that the MTP-MZI mode monitor can monitor the fiber modes introduced from the external environment,providing both theoretical and experimental foundations for near-infrared all-fiber mode monitoring in optical information systems. 展开更多
关键词 near-infrared mode monitor Mach-Zehnder interferometer two-path structure all-fiber-format
在线阅读 下载PDF
Direction finding for wideband signal and multi-target with interferometer
5
作者 PENG Bo SUN Jikang LI Chao 《Journal of Systems Engineering and Electronics》 2025年第5期1132-1139,共8页
According to the measurement principle of the traditional interferometer,a narrowband signal model is established and used,however,for wideband signals or multiple signals,this model is invalid.For the problems of dir... According to the measurement principle of the traditional interferometer,a narrowband signal model is established and used,however,for wideband signals or multiple signals,this model is invalid.For the problems of direction finding with interferometer for wideband signals and multiple signals scene,a frequency domain phase interferometer is proposed and the concrete implementation scheme is given.The proposed method computes the phase difference in frequency domain,and finds multi-target results with judging the spectrum amplitude changing,and uses the frequency phase difference to compute the arrival angle.Theoretical analysis and simulation results show that the proposed method effectively solves the problem of the angle estimation with phase interferometer for wideband signals,and has good performance in multiple signals scene with nonoverlapping spectrum or partially overlapping.In addition,the wider the signal bandwidth,the better direction finding performance of this algorithm. 展开更多
关键词 phase interferometer wideband signal direction finding multi-signal direction finding frequency domain interferometer
在线阅读 下载PDF
Signal estimation bias in x-ray dark-field imaging using dual phase grating interferometer
6
作者 Zhi-Li Wang Zun Zhang +1 位作者 Heng Chen Xin Ge 《Chinese Physics B》 2025年第3期550-558,共9页
In x-ray dark-field imaging using dual phase grating interferometer,multi-contrast signals are extracted from a set of acquired phase-stepping data by using the least-squares fitting algorithm.The extracted mean inten... In x-ray dark-field imaging using dual phase grating interferometer,multi-contrast signals are extracted from a set of acquired phase-stepping data by using the least-squares fitting algorithm.The extracted mean intensity,amplitude and visibility signals may be intrinsically biased.However,it is still unclear how large these biases are and how the data acquisition parameters influence the biases in the extracted signals.This work set out to address these questions.Analytical expressions of the biases of the extracted signals were theoretically derived by using a second-order Taylor series expansion.Extensive numerical simulations were performed to validate the theoretical results.It is illustrated that while the estimated mean intensity signal is always unbiased,the estimated amplitude and visibility signals are both positively biased.While the biases of the estimated amplitude signals are proportional to the inverse of the total number of phase steps,the biases of the estimated visibility signals are inversely proportional to the product of the total number of phase steps and the mean number of photons counted per phase step.Meanwhile,it is demonstrated that the dependence of the biases on the mean visibility is quite different from that of Talbot-Lau interferometer due to the difference in the intensity model.We expect that these results can be useful for data acquisition optimizations and interpretation of x-ray dark-field images. 展开更多
关键词 x-ray imaging dual phase grating interferometer dark-field imaging signal bias
原文传递
Temporal SU(1,1) Interferometer Based on Four- Wave Mixing Time Lens and Its Applications in Ultrafast Time-Frequency Manipulation
7
作者 Tianyu Liu Zepeng Liu 《Journal of Electronic Research and Application》 2025年第4期327-336,共10页
Temporal optics,which enables lossless manipulation of ultrafast pulses,offers a new dimension for the regulation of quantum optical fields.In this paper,we established a temporal Fourier transform(TF)system based on ... Temporal optics,which enables lossless manipulation of ultrafast pulses,offers a new dimension for the regulation of quantum optical fields.In this paper,we established a temporal Fourier transform(TF)system based on a four-wave mixing(FWM)time lens and constructed a full quantum theoretical model for the resulting temporal SU(1,1)interferometer.This interferometer has high temporal resolution,can impose interference in both time and frequency domains,and is sensitive to the phase derivative.By introducing linear time-varying phase modulation,we achieved sub-picosecond precision in temporal autocorrelation measurements and generatedan optical frequency comb with a fixed interval based on a feedback iteration mechanism.Theoretical analysis revealsthe crucial regulatory role of time-frequency coupling in quantum interference,providing novel solutions for ultrafast quantum imaging,temporal mode encoding,and the generation of optical frequency quantization. 展开更多
关键词 Temporal SU(1 1)interferometer Four-wave mixing time lens Optical frequency comb Temporal optics
在线阅读 下载PDF
Space-Borne Interferometers to Detect Thousands of Memory Signals Emitted by Stellar-Mass Binary Black Holes
8
作者 Shaoqi Hou Zhi-Chao Zhao +1 位作者 Zhoujian Cao Zong-Hong Zhu 《Chinese Physics Letters》 2025年第10期323-330,共8页
The gravitational memory effect manifests gravitational nonlinearity,degenerate vacua,and asymptotic symmetries;its detection is considered challenging.We propose using a space-borne interferometer to detect memory si... The gravitational memory effect manifests gravitational nonlinearity,degenerate vacua,and asymptotic symmetries;its detection is considered challenging.We propose using a space-borne interferometer to detect memory signals from stellar-mass binary black holes(BBHs),typically targeted by ground-based detectors.We use DECIGO detector as an example.Over 5 years,DECIGO is estimated to detect approximately 2,036 memory signals(SNRs>3)from stellar-mass BBHs.Simulations used frequency-domain memory waveforms for direct SNR estimation.Predictions utilized a GWTC-3 constrained BBH population model(Power law+Peak mass,DEFAULT spin,Madau-Dickinson merger rate).The analysis used conservative lower merger rate limits and considered orbital eccentricity.The high detection rate stems from strong memory signals within DECIGO’s bandwidth and the abundance of stellar-mass BBHs.This substantial and conservative detection count enables statistical use of the memory effect for fundamental physics and astrophysics.DECIGO exemplifies that space interferometers may better detect memory signals from smaller mass binaries than their typical targets.Detectors in lower frequency bands are expected to find strong memory signals from∼10^(4)M⊙binaries. 展开更多
关键词 space borne interferometer detect memory signals gravitational memory effect decigo detector binary black holes bbhs typically stellar mass binary black holes signal noise ratio
原文传递
Research on a compact and high sensitivity gas pressure sensor based on fiber Fabry-Pérot interferometer and Bragg grating
9
作者 LIU Qinpeng XING Meihua +2 位作者 YANG Di LIU Bo YAN Cheng 《Optoelectronics Letters》 2025年第6期321-327,共7页
A compact and highly sensitive gas pressure and temperature sensor based on Fabry-Pérot interferometer(FPI)and fiber Bragg grating(FBG)is proposed and demonstrated experimentally in this paper.The theoretical mod... A compact and highly sensitive gas pressure and temperature sensor based on Fabry-Pérot interferometer(FPI)and fiber Bragg grating(FBG)is proposed and demonstrated experimentally in this paper.The theoretical model for pressure and temperature sensing is established.Building on this foundation,a novel micro silicon cavity sensor structure sensitive to pressure is devised downstream of an FBG.The concept of separate measurement and the mechanisms enhancing pressure sensitivity are meticulously analyzed,and the corresponding samples are fabricated.The experimental results indicate that the pressure sensitivity of the sensor is-747.849 nm/MPa in 0—100 k Pa and its linearity is 99.7%and it maintains good stability in 150 min.The sensor offers the advantages of compact size,robust construction,easy fabrication,and high sensitivity,making it potentially valuable for micro-pressure application. 展开更多
关键词 fiber bragg grating fbg gas pressure sensor temperature sensor separate measurement fiber Bragg grating fiber Fabry P rot interferometer theoretical model pressure temperature sensing micro silicon cavity sensor structure
原文传递
基于线程的MPI通信加速器技术研究 被引量:12
10
作者 刘志强 宋君强 +1 位作者 卢风顺 赵娟 《计算机学报》 EI CSCD 北大核心 2011年第1期154-164,共11页
为了针对多核系统构建更高效的MPI支撑环境,文中提出了一种基于线程的MPI加速器,称作MPIActor.MPIActor是一种用于协助传统MPI库的透明中间件,用户可以在编译期选择是否在单线程MPI程序中采用该中间件.加入MPIActor后,每个节点内的MPI... 为了针对多核系统构建更高效的MPI支撑环境,文中提出了一种基于线程的MPI加速器,称作MPIActor.MPIActor是一种用于协助传统MPI库的透明中间件,用户可以在编译期选择是否在单线程MPI程序中采用该中间件.加入MPIActor后,每个节点内的MPI进程都被映射成同一进程中的多个线程,从而节点内的通信可通过轻量级的线程通信机制实现.作者给出了MPIActor的基本设计,详细阐述了其工作机制、通信体系结构及关键技术,并在真实系统上分别针对MVAPICH2和OpenMPI并行环境利用OSU LATENCY基准测试进行了性能评测.实验结果表明在两种MPI环境上进行节点内8 KB^4 MB数据通信时MPIActor都能使通信性能平均提高一倍左右. 展开更多
关键词 mpi软件结构 线程mpi mpi加速器 mpiActor
在线阅读 下载PDF
基于MPI的二维大地电磁正演的并行计算 被引量:12
11
作者 李焱 胡祥云 +2 位作者 吴桂桔 叶益信 廖国忠 《地震地质》 EI CSCD 北大核心 2010年第3期392-401,共10页
大地电磁二维正演对每一个频率分别进行计算,各频率对应的电磁场值间相互独立,根据这一特点可以将程序按频率划分粒度,将每个频点计算分配到各个进程同时进行计算,并行执行。文中给出了大地电磁二维有限元正演的并行算法,它结合了MPI的... 大地电磁二维正演对每一个频率分别进行计算,各频率对应的电磁场值间相互独立,根据这一特点可以将程序按频率划分粒度,将每个频点计算分配到各个进程同时进行计算,并行执行。文中给出了大地电磁二维有限元正演的并行算法,它结合了MPI的优点,采用主从并行模式、分频并行计算的并行方案来执行。为了检验编写的并行程序,对设计的2个模型进行试算,并与串行程序对比验证了该算法的可行性、正确性,为二维反演、三维正反演的并行计算提供了研究基础。 展开更多
关键词 大地电磁 mpi 二维 有限元 正演
在线阅读 下载PDF
基于SMP集群的MPI+OpenMP混合编程模型研究 被引量:19
12
作者 潘卫 陈燎原 +3 位作者 张锦华 李永革 潘莉 夏凡 《计算机应用研究》 CSCD 北大核心 2009年第12期4592-4594,共3页
讨论了MPI+OpenMP混合编程模型的特点及其实现方法。建立了对拉普拉斯偏微分方程求解的混合并行算法,并在HL-2A高性能计算系统上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。
关键词 对称式多处理器集群 消息传递界面 OPENMP mpi+OPENMP HL-2A高性能计算系统
在线阅读 下载PDF
基于MPI的遥感影像高效能并行处理方法研究 被引量:16
13
作者 沈占锋 骆剑承 +1 位作者 陈秋晓 盛昊 《中国图象图形学报》 CSCD 北大核心 2007年第12期2132-2136,共5页
采用基于不同尺度下的面向特征基元的影像分析方法对高分辨率遥感影像进行基于MPI的处理,即在对常规的影像数据划分方法进行总结分析的基础上,提出了基于特定环境下的非均匀数据划分策略;在进行基于影像数据库的MPI并行处理时,提出了一... 采用基于不同尺度下的面向特征基元的影像分析方法对高分辨率遥感影像进行基于MPI的处理,即在对常规的影像数据划分方法进行总结分析的基础上,提出了基于特定环境下的非均匀数据划分策略;在进行基于影像数据库的MPI并行处理时,提出了一种新的数据流分配方法。处理结果表明,这两种方法均能够在一定环境下取得比常规方法更高的效率。 展开更多
关键词 mpi 并行计算 信息提取 尺度 数据划分
在线阅读 下载PDF
一种新的MPI Allgather算法及其在万亿次机群系统上的实现与性能分析 被引量:9
14
作者 陈靖 张云泉 +1 位作者 张林波 袁伟 《计算机学报》 EI CSCD 北大核心 2006年第5期808-814,共7页
给出一个新的MPIAllgather算法———邻居交换算法(neighborexchange).提出的平均逻辑通信距离的概念和计算公式,可以有效地衡量通信的局部性.通过分析,发现在4种MPIAllgather算法中,邻居交换和环算法均具有最优的通信局部性.在万亿次... 给出一个新的MPIAllgather算法———邻居交换算法(neighborexchange).提出的平均逻辑通信距离的概念和计算公式,可以有效地衡量通信的局部性.通过分析,发现在4种MPIAllgather算法中,邻居交换和环算法均具有最优的通信局部性.在万亿次机群深腾6800和曙光4000A上对4个MPIAllgather算法进行的性能测试和分析结果表明,邻居交换算法的长消息通信性能最优,中长消息通信性能不稳定,短消息通信性能次于递归倍增和Bruck算法. 展开更多
关键词 mpi Allgather算法 集合通信 性能评测 机群
在线阅读 下载PDF
利用最小二乘直接法反演卫星重力场模型的MPI并行算法 被引量:12
15
作者 周浩 罗志才 +1 位作者 钟波 陆飚 《测绘学报》 EI CSCD 北大核心 2015年第8期833-839,857,共8页
针对海量卫星重力数据反演高阶次地球重力场模型的密集型计算任务与高内存耗用问题,基于MPI实现了最小二乘直接法恢复高阶次位系数的并行算法。引入并行读写、分块存储与分块计算等方式完成了设计矩阵的构建、法方程的形成与求解等密集... 针对海量卫星重力数据反演高阶次地球重力场模型的密集型计算任务与高内存耗用问题,基于MPI实现了最小二乘直接法恢复高阶次位系数的并行算法。引入并行读写、分块存储与分块计算等方式完成了设计矩阵的构建、法方程的形成与求解等密集型计算任务的并行算法,数值计算结果表明三者的并行相对效率峰值可分别达到95%、68%、63%。利用GOCE轨道跟踪和径向扰动重力梯度数据(共518 400个历元)分别反演了120、240阶次地球重力场模型,计算时间仅为40min、7h,内存耗用峰值仅为290MB、1.57GB;采用与GOCE同等噪声水平的观测数据恢复的重力场模型精度与GOCE已发布模型的解算精度相一致,联合GRACE和GOCE的解算模型能够实现二者独立信息的频谱互补,表明本文方法可高效稳定地恢复高阶次地球重力场模型。 展开更多
关键词 mpi 并行算法 卫星重力场模型 Gauss-Jordan算法 GOCE
在线阅读 下载PDF
基于MPI的一维大地电磁并行计算研究 被引量:9
16
作者 李焱 胡祥云 +3 位作者 金钢燮 吴桂桔 廖国忠 王程 《地球物理学进展》 CSCD 北大核心 2010年第5期1612-1616,共5页
在大地电磁中运用并行处理技术来减少计算时间,提高运算效率.结合一维广义逆矩阵法反演的计算特点,详细分析了串行程序并行化方法,主要采用主从并行模式、分频并行计算的并行方案.在Linux系统上使用Fortran和MPICH2相结合的开发工具编... 在大地电磁中运用并行处理技术来减少计算时间,提高运算效率.结合一维广义逆矩阵法反演的计算特点,详细分析了串行程序并行化方法,主要采用主从并行模式、分频并行计算的并行方案.在Linux系统上使用Fortran和MPICH2相结合的开发工具编写了并行程序,通过理论模型和实测数据对实现的并行程序进行试算,并与串行程序对比验证了该算法的可行性、正确性,为二维、三维的正反演并行计算提供了研究基础. 展开更多
关键词 大地电磁 mpi 并行计算 一维
在线阅读 下载PDF
基于MPI的塑件浇口优化设计 被引量:13
17
作者 范云霄 武迎迎 +1 位作者 赵国强 王方凯 《模具工业》 北大核心 2006年第12期53-56,共4页
针对浇口在塑料制品注射成型过程中的重要地位,在注射模设计中利用专业模流分析软件MPI对塑件浇口进行了优化设计。以手机面板为实例,介绍了MPI对其浇口位置和数量进行计算机模拟分析的过程,优化了模具浇口数量和位置,从而获得高预测质... 针对浇口在塑料制品注射成型过程中的重要地位,在注射模设计中利用专业模流分析软件MPI对塑件浇口进行了优化设计。以手机面板为实例,介绍了MPI对其浇口位置和数量进行计算机模拟分析的过程,优化了模具浇口数量和位置,从而获得高预测质量的产品,降低了生产成本,提高了模具企业的市场竞争力。 展开更多
关键词 浇口位置 PRO/E mpi 优化设计
在线阅读 下载PDF
基于集群MPI的图层级多边形并行合并算法 被引量:9
18
作者 范俊甫 马廷 +3 位作者 周成虎 季民 周玉科 许涛 《地球信息科学学报》 CSCD 北大核心 2014年第4期517-523,共7页
在集群环境下,基于MPI并行编程模型和OGC简单要素规范进行并行多边形合并时,需要处理叠加图层间要素的"多对多"映射关系,由于空间上相邻的多边形在要素序列上并不一定连续,导致无法按要素序列为子节点分配任务,给并行任务映... 在集群环境下,基于MPI并行编程模型和OGC简单要素规范进行并行多边形合并时,需要处理叠加图层间要素的"多对多"映射关系,由于空间上相邻的多边形在要素序列上并不一定连续,导致无法按要素序列为子节点分配任务,给并行任务映射带来了困难。本文以集群环境下的并行多边形合并算法为研究对象,通过比较叠加分析中两种多边形映射关系对算法并行化带来的影响,基于R树空间索引、MySQL精确空间查询,以及MPI通信机制,提出了6种不同的并行任务映射策略;通过实验分析和比较了6种策略的优劣。结果显示:基于R树预筛选的直接合并策略,在各算法中具有最高的串行计算效率和优秀的并行性能表现。虽然MySQL精确空间查询的预筛选过程较为耗时,但可有效地过滤掉不真正相交的多边形,从而提高合并操作的效率。因此,在集群MPI环境下,基于R树和MySQL精确空间查询的预筛选策略是解决并行任务映射难题,实现图层级多边形并行合并算法的有效途径。 展开更多
关键词 多边形合并 预筛选 任务映射 并行计算 mpi通信
原文传递
基于MPI瞬变电磁测深一维反演并行算法探究 被引量:5
19
作者 柳建新 刘鹏茂 +1 位作者 刘颖 童孝忠 《物探化探计算技术》 CAS CSCD 2011年第5期491-495,462,共5页
在瞬变电磁测深反演中运用并行技术可以减少计算时间,提高反演的运算效率。MPI(Message Passing Interface)是目前最重要的并行编程工具,它具有移植性好、功能强大、效率高等多种优点。这里基于在Windows系统下使用FORTRAN和MPICH2相结... 在瞬变电磁测深反演中运用并行技术可以减少计算时间,提高反演的运算效率。MPI(Message Passing Interface)是目前最重要的并行编程工具,它具有移植性好、功能强大、效率高等多种优点。这里基于在Windows系统下使用FORTRAN和MPICH2相结合的开发工具,编写瞬变电磁并行算法程序,对瞬变电磁一维采用直接反演法,通过理论模型对该算法进行试算,计算结果证明了该算法的正确性、高效性和稳定性。 展开更多
关键词 瞬变电磁 直接反演 并行计算 mpi
在线阅读 下载PDF
非结构CFD软件MPI+OpenMP混合并行及超大规模非定常并行计算的应用 被引量:13
20
作者 王年华 常兴华 +1 位作者 赵钟 张来平 《航空学报》 EI CAS CSCD 北大核心 2020年第10期185-199,共15页
常规工程应用中,非定常数值模拟(如多体分离)的计算量十分巨大,如果为了达到更高的计算精度,加密网格或者采用高精度方法将会使得计算量进一步增大,导致非定常数值模拟在CFD工程应用中成为十分耗时和昂贵的工作,因此,提高非定常数值模... 常规工程应用中,非定常数值模拟(如多体分离)的计算量十分巨大,如果为了达到更高的计算精度,加密网格或者采用高精度方法将会使得计算量进一步增大,导致非定常数值模拟在CFD工程应用中成为十分耗时和昂贵的工作,因此,提高非定常数值模拟的可扩展性和计算效率十分必要。为充分发挥既有分布内存又有共享内存的多核处理器的性能和效率优势,对作者团队开发的非结构网格二阶精度有限体积CFD软件(HyperFLOW)进行了混合并行改造,在计算节点间采用MPI消息传递机制,在节点内采用OpenMP共享内存的MPI+OpenMP混合并行策略。首先分别实现了两种粒度(粗粒度和细粒度)的混合并行,并基于国产in-house集群采用CRM标模(约4000万网格单元)定常湍流算例对两种混合并行模式进行了测试和比较。结果表明,粗粒度在进程数和分区数较少的小规模并行时具有效率优势,16线程时效率较高;而细粒度混合并行在大规模并行计算时具有优势,8线程时效率较高。其次,验证了混合并行在非定常计算情况下的可扩展性,采用机翼外挂物投放标模算例,分别生成3.6亿和28.8亿非结构重叠网格,采用对等的(P2P)网格读入模式和优化的重叠网格隐式装配策略,网格读入和重叠网格装配耗时仅需数十秒;采用3.6亿网格,完成了非定常状态效率测试及非定常分离过程的湍流流场计算,在in-house集群上12288核并行效率达到90%(以768核为基准),在天河2号上12288核并行效率达到70%(以384核为基准),数值模拟结果与试验结果符合良好。最后,在inhouse集群上采用28.8亿非结构重叠网格进行了4.9万核的并行效率测试,结果显示,4.9万核并行效率达到55.3%(以4096核为基准)。 展开更多
关键词 mpi+OpenMP混合并行 并行效率 计算流体力学 重叠网格 非定常计算
原文传递
上一页 1 2 250 下一页 到第
使用帮助 返回顶部