期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于MPI和OpenCV遥感图像匹配的并行实现 被引量:2
1
作者 崔丹丹 张耀南 赵国辉 《计算机应用》 CSCD 北大核心 2014年第A01期203-205,共3页
灰度匹配是遥感图像处理中一项重要技术,匹配方法虽然精度高,但计算量大,时间长。针对这一问题,介绍了遥感图像灰度匹配的并行策略,基于消息传递接口(MPI)和开源计算机视觉库(OpenCV)实现了归一化积相关灰度匹配并行算法,并依此算法来... 灰度匹配是遥感图像处理中一项重要技术,匹配方法虽然精度高,但计算量大,时间长。针对这一问题,介绍了遥感图像灰度匹配的并行策略,基于消息传递接口(MPI)和开源计算机视觉库(OpenCV)实现了归一化积相关灰度匹配并行算法,并依此算法来验证遥感灰度匹配的并行性能。实验结果表明,该算法能获得良好的加速比且并行效率大于1,说明基于该算法的遥感图像匹配可以显著提高遥感图像处理的效率。 展开更多
关键词 遥感图像处理 图像匹配 消息传递接口 开源计算机视觉库
在线阅读 下载PDF
An efficient large-scale mesh deformation method based on MPI/Open MP hybrid parallel radial basis function interpolation 被引量:5
2
作者 Zhong ZHAO Rong MA +2 位作者 Lei HE Xinghua CHANG Laiping ZHANG 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2020年第5期1392-1404,共13页
An efficient MPI/OpenMP hybrid parallel Radial Basis Function (RBF) strategy for both continuous and discontinuous large-scale mesh deformation is proposed to reduce the computational cost and memory consumption.Unlik... An efficient MPI/OpenMP hybrid parallel Radial Basis Function (RBF) strategy for both continuous and discontinuous large-scale mesh deformation is proposed to reduce the computational cost and memory consumption.Unlike the conventional parallel methods in which all processors use the same surface displacement and implement the same operation,the present method employs different surface points sets and influence radius for each volume point movement,accompanied with efficient geometry searching strategy.The deformed surface points,also called Control Points (CPs),are stored in each processor.The displacement of spatial points is interpolated by using only 20-50 nearest control points,and the local influence radius is set to 5-20 times the maximum displacement of control points.To shorten the searching time for the nearest control point clouds,an Alternating Digital Tree (ADT) algorithm for 3D complex geometry is designed based on an iterative bisection technique.Besides,an MPI/OpenMP hybrid parallel approach is developed to reduce the memory cost in each High-Performance Computing (HPC) node for large-scale applications.Three 3D cases,including the ONERA-M6 wing and a commercial transport airplane standard model with up to 2.5 billion hybrid elements,are used to test the present mesh deformation method.The robustness and high parallel efficiency are demonstrated by a wing deflection case with a maximum bending angle of 450 and more than 80% parallel efficiency with 1024 MPI processors.In addition,the availability for both continuous and discontinuous surface deformation is verified by interpolating the projecting displacement with opposite directions surface points to the spatial points. 展开更多
关键词 Mesh deformation Moving mesh generation mpi/open MP hybrid parallel computing Parallel radial basis function interpolation Unstructured hybrid grid
原文传递
MPI系统中共享内存通信技术研究 被引量:1
3
作者 张洋 卢宇彤 蒋艳凰 《现代电子技术》 2010年第19期179-182,共4页
MPI是消息传递并行程序设计接口,目前已经成为主流的并行编程模式。多核处理系统的出现,使得高性能计算更加关注节点内的进程通信性能。介绍多种节点内通信协议,以及两种MPI实现(Open MPI和MPICH2)的结构,并对其中基于共享内存的消息传... MPI是消息传递并行程序设计接口,目前已经成为主流的并行编程模式。多核处理系统的出现,使得高性能计算更加关注节点内的进程通信性能。介绍多种节点内通信协议,以及两种MPI实现(Open MPI和MPICH2)的结构,并对其中基于共享内存的消息传递功能采用的通信协议进行了研究,最后对两者的点点通信性能测试结果进行了比较和分析同时提出了优化策略。 展开更多
关键词 open mpi mpiCH2 多核 共享内存 SM nemesis
在线阅读 下载PDF
高分三号数据分布式负载均衡并行转换算法
4
作者 邱祥峰 《厦门理工学院学报》 2024年第5期33-39,共7页
针对PolSARpro软件原有高分三号数据转换模块无法适应分布式环境及数据转换效率相对较低的问题,提出一种基于MPI、MapReduce和OpenMP并按照该软件的数据格式要求进行分布式负载均衡的并行转换算法。该算法外层采用MPI按任务分布式计算,... 针对PolSARpro软件原有高分三号数据转换模块无法适应分布式环境及数据转换效率相对较低的问题,提出一种基于MPI、MapReduce和OpenMP并按照该软件的数据格式要求进行分布式负载均衡的并行转换算法。该算法外层采用MPI按任务分布式计算,中间层采用MapReduce按景并行处理,内层采用OpenMP按极化方式并行计算,并采用“Z”字形数据负载均衡策略,将高分三号不同成像模式下的多极化数据快速精确定标及格式转换,以抗数据偏斜。实际数据的测试结果表明,该算法的整体性能提升了约50%,验证了算法的可行性、高效性和正确性。 展开更多
关键词 高分三号卫星 合成孔径雷达 分布式负载均衡 并行转换算法 共享存储并行编程 映射归约编程模型 消息传递接口
在线阅读 下载PDF
消息传递机制的比较及其最新发展 被引量:2
5
作者 尚亚灵 袁道华 +1 位作者 丁莹 曾祥洪 《计算机工程与设计》 CSCD 北大核心 2007年第10期2265-2269,共5页
消息传递机制在分布式计算中发挥着很重要的作用。随着人们对高性能计算需求的不断扩大和各种新技术的出现,消息传递机制也处于不断的发展和完善之中。首先对两种主要的消息传递系统PVM和MPI进行了详尽的比较,比如背景、目标、移植性、... 消息传递机制在分布式计算中发挥着很重要的作用。随着人们对高性能计算需求的不断扩大和各种新技术的出现,消息传递机制也处于不断的发展和完善之中。首先对两种主要的消息传递系统PVM和MPI进行了详尽的比较,比如背景、目标、移植性、通信等;然后针对它们的现状列举了最新发展情况;最后归纳了消息传递机制的发展趋势。 展开更多
关键词 消息传递机制 并行虚拟机 消息传递接口 并行虚拟机融合消息传递接口 异构自适应可重置网络系统 开放 消息传递接口 适应网格的消息传递
在线阅读 下载PDF
改革开放后中国政府效率改进的数量分析 被引量:11
6
作者 冯涛 李湛 《统计与信息论坛》 CSSCI 2010年第1期3-8,共6页
把政府视为联合供给公共品的组织,根据政府供给的主要公共品建立复合指标体系,采用DEA模型中的MPI指数计算改革开放以来中国政府效率的改进状况,结果显示:绝大多数年份中中国政府效率都不断得到高速改进,平均改进速度甚至超过同期中国GD... 把政府视为联合供给公共品的组织,根据政府供给的主要公共品建立复合指标体系,采用DEA模型中的MPI指数计算改革开放以来中国政府效率的改进状况,结果显示:绝大多数年份中中国政府效率都不断得到高速改进,平均改进速度甚至超过同期中国GDP增长率。结果表明:中国现行政府体制存在相对有效的自我完善机制,中国政府改革的主要方向是符合当前发展阶段的要求的。在数量分析的基础上,提出中国政府进一步改革可能需要重点关注的方面。 展开更多
关键词 改革开放 复合指标体系 政府效率 mpi
在线阅读 下载PDF
基于EnFCM的海量图像聚类分割算法的并行研究 被引量:3
7
作者 左利云 罗成煜 左右祥 《微型机与应用》 2015年第15期55-58,共4页
图像分割的处理速度成为大规模图像数据处理的瓶颈。本文提出一种基于En FCM的图像聚类分割模型,直接对图像像素的灰度级进行聚类,能显著提高图像聚类分割的处理速度。为进一步提高处理速度,结合En FCM图像聚类分割模型特点,设计了三种... 图像分割的处理速度成为大规模图像数据处理的瓶颈。本文提出一种基于En FCM的图像聚类分割模型,直接对图像像素的灰度级进行聚类,能显著提高图像聚类分割的处理速度。为进一步提高处理速度,结合En FCM图像聚类分割模型特点,设计了三种并行优化策略——纯MPI并行方法、MPI+Open MP混合编程方法和CUDA并行架构方法 ,使其适合于大规模图像处理。实验结果表明,提出的三种并行优化策略都取得良好的加速效果。 展开更多
关键词 图像聚类分割 FCM算法 mpi+open MP CUDA
在线阅读 下载PDF
基于并行技术的在线监测系统燃耗计算优化开发 被引量:3
8
作者 郭凤晨 高露露 +5 位作者 芦韡 赵德华 于洋 徐睿杰 马永强 魏桐 《核动力工程》 EI CSCD 北大核心 2023年第S02期29-32,共4页
为了提高在线监测系统程序DESCAR模块在燃耗区数目较大时燃耗计算求解的计算效率,本文使用开放式多处理(OpenMP)和信息传递接口(MPI)并行技术,对DESCAR模块进行优化重构,以提高在线监测系统程序的计算效率。验证结果表明,优化重构后的DE... 为了提高在线监测系统程序DESCAR模块在燃耗区数目较大时燃耗计算求解的计算效率,本文使用开放式多处理(OpenMP)和信息传递接口(MPI)并行技术,对DESCAR模块进行优化重构,以提高在线监测系统程序的计算效率。验证结果表明,优化重构后的DESCAR模块在保证计算结果正确性的同时,可以有效地提高在线监测系统程序的计算速度,加速效果显著,满足在线监测系统实时性的要求。 展开更多
关键词 并行技术 燃耗计算 开放式多处理(openMP) 信息传递接口(mpi)
原文传递
Energy optimization of representative barrier algorithms
9
作者 陈娟 董勇 《Journal of Central South University》 SCIE EI CAS 2012年第10期2823-2831,共9页
Too high energy consumption is widely recognized to be a critical problem in large-scale parallel computing systems.The LogP-based energy-saving model and the frequency scaling method were proposed to reduce energy co... Too high energy consumption is widely recognized to be a critical problem in large-scale parallel computing systems.The LogP-based energy-saving model and the frequency scaling method were proposed to reduce energy consumption analytically and systematically for other two representative barrier algorithms:tournament barrier and central counter barrier.Furthermore,energy optimization methods of these two barrier algorithms were implemented on parallel computing platform.The experimental results validate the effectiveness of the energy optimization methods.67.12% and 70.95% energy savings are obtained respectively for tournament barrier and central counter barrier on platforms with 2048 processes with 1.55%?8.80% performance loss.Furthermore,LogP-based energy-saving analytical model for these two barrier algorithms is highly accurate as the predicted energy savings are within 9.67% of the results obtained by simulation. 展开更多
关键词 energy saving tournament barrier central counter barrier LOGP open mpi
在线阅读 下载PDF
针对特普利茨线性系统的多级并行算法
10
作者 张哲 《计算机工程》 CAS CSCD 北大核心 2011年第1期36-38,共3页
利用并行体系结构中不同层次级别的内存和计算单元,提出一种求解对称结构化特普利茨线性系统的多级并行算法。通过数学推导将特普利茨线性系统转换成柯西式线性系统,利用消息传递接口和开放多平台共享内存并行程序设计工具实现该算法,... 利用并行体系结构中不同层次级别的内存和计算单元,提出一种求解对称结构化特普利茨线性系统的多级并行算法。通过数学推导将特普利茨线性系统转换成柯西式线性系统,利用消息传递接口和开放多平台共享内存并行程序设计工具实现该算法,并通过实验验证其可行性。 展开更多
关键词 特普利茨矩阵 柯西式矩阵 多级并行程序设计 消息传递接口 开放多平台共享内存并行程序设计
在线阅读 下载PDF
多核CPU下的K-means遥感影像分类并行方法 被引量:11
11
作者 吴洁璇 陈振杰 +2 位作者 张云倩 骈宇哲 周琛 《计算机应用》 CSCD 北大核心 2015年第5期1296-1301,共6页
针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并... 针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并行加速。利用大数据量的多尺度遥感影像进行实验,结果表明:所提并行方法可大大减少遥感影像的分类时间,取得了良好的加速比(13.83),并可达到负载均衡,从而解决了大区域遥感影像快速分类的问题。 展开更多
关键词 K-MEANS算法 并行计算 负载均衡 数据粒度划分 消息传递接口 open MP
在线阅读 下载PDF
基于CPU与GPU的异构模板计算优化研究 被引量:5
12
作者 李博 黄东强 +3 位作者 贾金芳 吴利 王晓英 黄建强 《计算机工程》 CAS CSCD 北大核心 2023年第4期131-137,共7页
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基... 模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种混合计算模型。相较于常规的MPI计算模型,MPI+OpenMP计算模型通过使用MPI进行多节点之间的粗粒度通信,使用OpenMP实现进程内部的细粒度并行计算,并结合单指令多数据、非一致内存访问、数据预取、数据分块等技术,提高模板计算过程中的缓存命中率与计算并行能力,加快计算速度。在只采用CUDA进行模板计算时,CPU的计算资源没有得到充分利用,浪费了大量计算资源,CUDA+OpenMP计算模型通过对计算任务的负载划分让CPU也参与到计算中,以减少通信开销及充分利用CPU的多核并行计算能力。实验结果表明,OpenMP+MPI计算模型相较于MPI计算模型的平均加速比为3.67,CUDA+OpenMP计算模型相较于CUDA计算模型的平均加速比为1.26,OpenMP+MPI和CUDA+OpenMP两种计算模型的性能均得到了显著提升。 展开更多
关键词 模板计算 消息传递接口 跨平台多线程 单指令多数据 非一致内存访问 统一计算设备架构
在线阅读 下载PDF
一种基于多核集群的海量数据加密存储策略研究
13
作者 武艳娜 赵泽茂 +1 位作者 胡晶芳 梁斌 《信息网络安全》 2015年第8期35-40,共6页
随着互联网和云计算技术的快速发展,云计算中海量用户隐私和数据的安全问题已经越来越引起人们的关注,而加密是保护数据安全的首选方法。为了快速而有效地实现海量数据的安全存储,文章在研究多核处理器集群在海量数据加密存储中的应用... 随着互联网和云计算技术的快速发展,云计算中海量用户隐私和数据的安全问题已经越来越引起人们的关注,而加密是保护数据安全的首选方法。为了快速而有效地实现海量数据的安全存储,文章在研究多核处理器集群在海量数据加密存储中的应用的基础上,提出在多核Linux集群上使用混合Open MP&MPI技术来处理海量数据的解决方案,为多核集群提供在集群节点内部以及节点之间的并行策略,实现海量数据并行处理的层次结构化。同时采用并行虚拟文件系统PVFS2作为多核集群的文件系统,利用其并行I/O的特点实际解决集群系统中海量数据并行存储的问题。文章在多核集群上开发了一个海量数据加密与存储系统摸型。实验结果表明,该系统模型不仅能够有效实现海量数据的存储,还能为海量数据的安全起到一定的保护作用。 展开更多
关键词 多核集群 海量数据 加密存储 open MP mpi PVFS2
在线阅读 下载PDF
蒙特卡洛法期权定价的改进 被引量:2
14
作者 朱彦辑 《信息与电脑》 2017年第5期106-108,112,共4页
蒙特卡洛模拟方法是用于期权定价的几大方法之一。蒙特卡洛方法的理论基础是概率论与数理统计,其想法是假设资产价格分布是随机波动,如果知道了这个波动过程,就可以通过随机模拟不同的路径,每做完一次模拟,就产生了一个最终资产价值,再... 蒙特卡洛模拟方法是用于期权定价的几大方法之一。蒙特卡洛方法的理论基础是概率论与数理统计,其想法是假设资产价格分布是随机波动,如果知道了这个波动过程,就可以通过随机模拟不同的路径,每做完一次模拟,就产生了一个最终资产价值,再进行若干次这样的过程,那么所得到的结果就是一个最终的资产价值分布,从这个分布中可以得到期望的资产价格。蒙特卡洛方法的最大优势是误差收敛率不依赖于问题的维数,但若在获得精确定价结果的要求下,蒙特卡洛法需要进行上百万次的模拟,计算量巨大,为改进蒙特卡洛模拟,笔者考虑采用并行模拟的方法,能有效提高计算效率。 展开更多
关键词 蒙特卡洛模拟 BLACK-SCHOLES方程 并行计算 open MP mpi
在线阅读 下载PDF
大规模并行粒子模拟系统通信性能优化研究与分析 被引量:2
15
作者 何牧君 郭力 严历 《计算机与应用化学》 CAS CSCD 北大核心 2008年第9期1098-1102,共5页
随着粒子模拟在化工、材料、生物等领域应用不断深入,计算规模越来越大,运行一个作业需要的高性能集群节点数也越来越多。因此,降低网络通信所占总运行时间开销成为提高粒子模拟系统整体运行性能的关键环节之一。本文测试了不同MPI消息... 随着粒子模拟在化工、材料、生物等领域应用不断深入,计算规模越来越大,运行一个作业需要的高性能集群节点数也越来越多。因此,降低网络通信所占总运行时间开销成为提高粒子模拟系统整体运行性能的关键环节之一。本文测试了不同MPI消息传递环境、英特尔I/O加速技术以及网络设备驱动参数设置在多相复杂系统国家重点实验室高性能计算集群上的性能发挥情况,并通过优化有效提高了网络通信性能。最后对GAMMA等用户层通信协议替代TCP/IP通信协议进行了初步的可行性测试。 展开更多
关键词 粒子模拟 并行计算 open mpi 英特尔I/O加速技术 GAMMA
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部