期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
A Parallel Hybrid Testing Technique for Tri-Programming Model-Based Software Systems
1
作者 Huda Basloom Mohamed Dahab +3 位作者 Abdullah Saad AL-Ghamdi Fathy Eassa Ahmed Mohammed Alghamdi Seif Haridi 《Computers, Materials & Continua》 SCIE EI 2023年第2期4501-4530,共30页
Recently,researchers have shown increasing interest in combining more than one programming model into systems running on high performance computing systems(HPCs)to achieve exascale by applying parallelism at multiple ... Recently,researchers have shown increasing interest in combining more than one programming model into systems running on high performance computing systems(HPCs)to achieve exascale by applying parallelism at multiple levels.Combining different programming paradigms,such as Message Passing Interface(MPI),Open Multiple Processing(OpenMP),and Open Accelerators(OpenACC),can increase computation speed and improve performance.During the integration of multiple models,the probability of runtime errors increases,making their detection difficult,especially in the absence of testing techniques that can detect these errors.Numerous studies have been conducted to identify these errors,but no technique exists for detecting errors in three-level programming models.Despite the increasing research that integrates the three programming models,MPI,OpenMP,and OpenACC,a testing technology to detect runtime errors,such as deadlocks and race conditions,which can arise from this integration has not been developed.Therefore,this paper begins with a definition and explanation of runtime errors that result fromintegrating the three programming models that compilers cannot detect.For the first time,this paper presents a classification of operational errors that can result from the integration of the three models.This paper also proposes a parallel hybrid testing technique for detecting runtime errors in systems built in the C++programming language that uses the triple programming models MPI,OpenMP,and OpenACC.This hybrid technology combines static technology and dynamic technology,given that some errors can be detected using static techniques,whereas others can be detected using dynamic technology.The hybrid technique can detect more errors because it combines two distinct technologies.The proposed static technology detects a wide range of error types in less time,whereas a portion of the potential errors that may or may not occur depending on the 4502 CMC,2023,vol.74,no.2 operating environment are left to the dynamic technology,which completes the validation. 展开更多
关键词 Software testing hybrid testing technique OpenACC openmp MPI tri-programming model exascale computing
在线阅读 下载PDF
基于OpenMP的遥感影像并行ISODATA聚类研究 被引量:11
2
作者 刘扬 王鹏 +4 位作者 杨瑞 左宪禹 张周威 吴晓洋 渠涧涛 《计算机工程》 CAS CSCD 北大核心 2016年第7期238-243,250,共7页
针对传统影像分类算法执行效率较低,无法满足海量高分辨率遥感数据实时处理需求的问题,对资源三号卫星专题产品中遥感影像的迭代自组织数据分析算法进行分析与研究,设计一种基于OpenMP的并行ISODATA聚类算法(PIsodata Omp)。采用OpenMP... 针对传统影像分类算法执行效率较低,无法满足海量高分辨率遥感数据实时处理需求的问题,对资源三号卫星专题产品中遥感影像的迭代自组织数据分析算法进行分析与研究,设计一种基于OpenMP的并行ISODATA聚类算法(PIsodata Omp)。采用OpenMP技术优化ISODATA算法中的样本点聚类、聚类样本中心标准差计算,实现基于共享内存的单机多核并行化处理。实验结果表明,PIsodata Omp算法能在保证分类精度不变的情况下,明显提高资源三号卫星影像数据的处理速度。 展开更多
关键词 并行聚类 迭代自组织数据分析算法 openmp技术 遥感影像分类 多核处理
在线阅读 下载PDF
Level set函数快速步进重构并行算法的改进 被引量:4
3
作者 黄筱云 董国海 +1 位作者 常佳夫 蒋学炼 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2017年第6期836-842,共7页
为提高level set函数快速步进重构过程的并行计算效率,本文提出一种改进的分区并行重构算法。与原有分区并行算法相比,优化了子区域间的同步方案,缩短了level set函数并行重构的计算时间。运用OpenMP多线程技术,建立了相应的并行计算模... 为提高level set函数快速步进重构过程的并行计算效率,本文提出一种改进的分区并行重构算法。与原有分区并行算法相比,优化了子区域间的同步方案,缩短了level set函数并行重构的计算时间。运用OpenMP多线程技术,建立了相应的并行计算模型,实现了圆球、圆环管和哑铃等值面并行重构。并行重构数值结果表明:只要子区域均分初始表面边界,level set函数全局或局部并行重构均具有良好加速比,8线程的最大加速比可接近6。 展开更多
关键词 LEVEL set函数 快速步进法 重构 并行算法 多线程技术 openmp多线程技术
在线阅读 下载PDF
浅层初至波旅行时层析并行算法及在地裂缝调查中的应用 被引量:6
4
作者 俞岱 孙渊 +2 位作者 路婧 王颖 边瑞峰 《物探与化探》 CAS CSCD 2017年第5期977-985,共9页
随着浅层地裂缝等地质灾害问题精细探测需求的增大,采用初至波速度层析反演技术,可以提供较高精度的浅层速度场的纵横向异常变化,可为识别地裂缝等地质灾害现象提供依据。通常,在采集参数一定的条件下,其反演成像精度受算法、网格类型... 随着浅层地裂缝等地质灾害问题精细探测需求的增大,采用初至波速度层析反演技术,可以提供较高精度的浅层速度场的纵横向异常变化,可为识别地裂缝等地质灾害现象提供依据。通常,在采集参数一定的条件下,其反演成像精度受算法、网格类型和剖分尺度的限制,在网格类型不变的条件下,要提高精度就必须加密正反演计算网格,改进算法,从而实现增量而不减速且高精度的效果。文中利用OpenMP的单机多核并行技术,探讨并实现了初至波层析成像并行算法,其中正演部分使用了改进的旅行时线性插值法,针对原有的按列计算,加入了按行计算,充分考虑到来自各方向的射线,使得计算出的旅行时最小,反演部分使用了能迅速稳定收敛的LSQR法以及正则化技术,通过理论和实际资料测试,其收敛速度快,反演结果较好。同时,在加密采样和缩小网格尺度的条件下,与常规串行算法相比,其运算速度和效率有较大提高,与商业软件比较,其运算效率差异不大,但反演结果的精度和可分辨性较好。 展开更多
关键词 初至波层析 正反演 openmp并行技术 计算速度 超线程技术 地裂缝
在线阅读 下载PDF
基于区域匹配的实时加速技术 被引量:2
5
作者 陈华华 杜歆 顾伟康 《传感技术学报》 EI CAS CSCD 北大核心 2006年第1期170-174,共5页
针对区域立体匹配计算量大实时性差的困难,分析了相关匹配算法的实际工作过程,采用消除冗余因子和Box滤波、多级分辨率匹配减小计算复杂度,对算法结构进行了改进和优化,并利用超线程和OpenMP技术对算法进行了加速,提出了一种实时区域匹... 针对区域立体匹配计算量大实时性差的困难,分析了相关匹配算法的实际工作过程,采用消除冗余因子和Box滤波、多级分辨率匹配减小计算复杂度,对算法结构进行了改进和优化,并利用超线程和OpenMP技术对算法进行了加速,提出了一种实时区域匹配算法。对算法进行实验,结果表明算法符合了视觉导航的准确性和实时性要求,并且对于提高其他区域匹配算法实时性也具有重要借鉴意义。 展开更多
关键词 实时匹配 openmp 超线程技术 优化 相关匹配算法
在线阅读 下载PDF
基于快速置信传播算法的并行主题建模方法研究 被引量:1
6
作者 高恩婷 顾一清 严建峰 《南通大学学报(自然科学版)》 CAS 2013年第1期1-8,共8页
基于OpenMP技术提出并行置信传播算法,在多核服务器上通过共享内存的方式快速推断潜在狄利克雷分布(LDA)主题模型的参数,建立文本中不同主题与文本表面单词之间的联系.利用Enron和Wikipedia数据集,通过3组实验对比了传统吉布斯算法和并... 基于OpenMP技术提出并行置信传播算法,在多核服务器上通过共享内存的方式快速推断潜在狄利克雷分布(LDA)主题模型的参数,建立文本中不同主题与文本表面单词之间的联系.利用Enron和Wikipedia数据集,通过3组实验对比了传统吉布斯算法和并行置信传播算法的运行效果.结果表明,并行置信传播算法能够快速推断LDA模型参数,高效处理大规模数据,比传统吉布斯采样算法具有更高的精度. 展开更多
关键词 置信传播 主题模型 潜在狄利克雷分布 openmp技术
在线阅读 下载PDF
含有跨迭代数据依赖关系循环的自动并行化 被引量:1
7
作者 张琼声 李莹 +1 位作者 范志东 李吉乐 《小型微型计算机系统》 CSCD 北大核心 2014年第6期1293-1297,共5页
OpenMP是为在多处理机上编写并行程序而设计的一个应用编程接口,在串行程序中简单插入OpenMP编译指导语句,编译器就可自动将串行程序并行化.但用OpenMP对for循环进行并行化时,要求循环各次迭代之间不能含有数据依赖关系.文中提出了一种... OpenMP是为在多处理机上编写并行程序而设计的一个应用编程接口,在串行程序中简单插入OpenMP编译指导语句,编译器就可自动将串行程序并行化.但用OpenMP对for循环进行并行化时,要求循环各次迭代之间不能含有数据依赖关系.文中提出了一种对含有跨迭代数据依赖关系的for循环进行OpenMP自动并行化的方法.该方法首先对串行程序的GCC抽象语法树文本进行冗余信息消除,以提取程序的有用信息;然后利用这些信息分析循环是否含有跨迭代数据依赖关系,若有则采用预计算(pre-computation)技术消除跨迭代数据依赖关系;最后自动生成带有OpenMP编译指导语句的并行程序.实验结果表明该方法对于某些含有跨迭代数据依赖关系的循环来说是有效的. 展开更多
关键词 openmp 自动并行化 抽象语法树文本 冗余信息消除 跨迭代数据依赖 预计算技术
在线阅读 下载PDF
小干扰稳定分析中状态矩阵的快速形成 被引量:2
8
作者 罗丹 王克文 王君亮 《电测与仪表》 北大核心 2015年第10期56-60,91,共6页
电力系统小干扰稳定分析中形成状态矩阵的计算需求随系统规模扩大而急剧增加。通过分析状态矩阵的形成过程、重组相关算式、引入矩阵降阶求逆等方法,提高计算速度。针对插入式建模技术,将一阶状态传输块、关联矩阵和一阶导数的算式混合... 电力系统小干扰稳定分析中形成状态矩阵的计算需求随系统规模扩大而急剧增加。通过分析状态矩阵的形成过程、重组相关算式、引入矩阵降阶求逆等方法,提高计算速度。针对插入式建模技术,将一阶状态传输块、关联矩阵和一阶导数的算式混合;通过进一步的算式变换,形成状态矩阵的最终表达式。矩阵求逆采用分块矩阵降阶求逆的方法,矩阵存储采用三元组技术,处理循环及独立的程序段等采用Open MP技术的并行计算功能。对两个不同规模的算例进行分析比较,验证所提方法的有效性。 展开更多
关键词 状态矩阵 矩阵求逆 稀疏技术 openmp
在线阅读 下载PDF
联合EGM2008模型重力异常和GOCE观测数据构建超高阶地球重力场模型SGG-UGM-1 被引量:24
9
作者 梁伟 徐新禹 +1 位作者 李建成 朱广彬 《测绘学报》 EI CSCD 北大核心 2018年第4期425-434,共10页
本文研究了联合卫星观测数据和重力异常数据确定超高阶重力场模型的理论方法,并使用EGM2008模型重力异常和GOCE(gravity field and ocean circulation explorer)观测数据构建了重力场模型SGG-UGM-1。重点研究了由球面格网重力异常快速... 本文研究了联合卫星观测数据和重力异常数据确定超高阶重力场模型的理论方法,并使用EGM2008模型重力异常和GOCE(gravity field and ocean circulation explorer)观测数据构建了重力场模型SGG-UGM-1。重点研究了由球面格网重力异常快速构建超高阶重力场模型的块对角最小二乘方法,将OpenMP技术引入到块对角最小二乘中以提高计算效率,并基于模拟数据验证了方法及算法和软件模块的正确性。采用本文制定的联合解算策略,利用GOCE重力卫星观测数据构建的220阶次法方程和EGM2008模型重力异常构建的2159阶次块对角法方程,联合求解了2159阶次的重力场模型SGG-UGM-1。将SGG-UGM-1与EGM2008、EIGEN-6C2、EIGEN-6C4等超高阶模型在频谱域内进行了比较分析,结果表明SGG-UGM-1相对参考模型的系数误差较小,且在220阶次内的系数精度相比EGM2008模型有了提高。采用中国与美国的GPS/水准数据和毛乌素测区的航空重力观测数据对这些模型进行了外符合精度的检验。检核结果表明,在中国区域,SGG-UGM-1模型大地水准面的精度在EIGEN-6C2和EIGEN-6C4两个模型之间,优于GOSG-EGM模型和EGM2008模型,与美国区域几个模型的精度相当。利用毛乌素测区的航空重力数据对几个模型进行了检核,结果表明SGG-UGM-1模型计算的重力扰动精度与EGM2008、EIGEN-6C4模型相当,优于GOSG-EGM模型和EIGEN-6C2模型。 展开更多
关键词 SGG-UGM-1 超高阶重力场模型 块对角最小二乘方法 openmp并行计算
在线阅读 下载PDF
Windows环境下FFT多核并行算法的设计实现 被引量:4
10
作者 张燕燕 洪龙 《计算机技术与发展》 2010年第9期74-77,82,共5页
多核技术的问世,使得人们在桌面计算机环境下研究并行算法,运行并行程序成为可能。与此同时,如何充分利用多核技术进行并行程序设计却是所面临的巨大挑战。在叙述了多核技术,并将其与超线程技术比较后,介绍了Windows环境下的常用的多核... 多核技术的问世,使得人们在桌面计算机环境下研究并行算法,运行并行程序成为可能。与此同时,如何充分利用多核技术进行并行程序设计却是所面临的巨大挑战。在叙述了多核技术,并将其与超线程技术比较后,介绍了Windows环境下的常用的多核编程工具OpenMP,并重点描述了并行语句Fork/Join;在简述了信号处理中常用的FFT后,重点分析了FFT的按时间基2抽取形式,并据此利用OpenMP设计了一个n核环境下的FFT并行算法,通过对相应程序的运行,结果表明,该算法加速比接近n。 展开更多
关键词 多核技术 超线程技术 并行程序设计 Windows openmp FFT并行算法
在线阅读 下载PDF
Multi-threaded code generation from Signal program to OpenMP 被引量:2
11
作者 Kai HU Teng ZHANG Zhibin YANG 《Frontiers of Computer Science》 SCIE EI CSCD 2013年第5期617-626,共10页
The use of multi-core processors will become a trend in safety critical systems. For safe execution of multi- threaded code, automatic code generation from formal spec- ification is a desirable method. Signal, a synch... The use of multi-core processors will become a trend in safety critical systems. For safe execution of multi- threaded code, automatic code generation from formal spec- ification is a desirable method. Signal, a synchronous lan- guage dedicated for the functional description of safety crit- ical systems, provides soundness semantics for determinis- tic concurrency. Although sequential code generation of Sig- nal has been implemented in Polychrony compiler, deter- ministic multi-threaded code generation strategy is still far from mature. Moreover, existing code generation methods use certain multi-thread library, which limits the cross plat- form executions. OpenMP is an application program inter- face (API) standard for parallel programming, supported by several mainstream compilers from different platforms. This paper presents a methodology translating Signal program to OpenMP-based multi-threaded C code. First, the intermedi- ate representation of the core syntax of Signal using syn- chronous guarded actions is defined. Then, according to the compositional semantics of Signal equations, the Signal pro- gram is synthesized to dependency graph (DG). After par- allel tasks are extracted from dependency graph, the Signal program can be finally translated into OpenMP-based C code which can be executed on multiple platforms. 展开更多
关键词 multi-thread synchronous language Signal code generation openmp
原文传递
Parallel Region Reconstruction Technique for Sunway High-Performance Multi-core Processors
12
作者 Kai Nie Qinglei Zhou +3 位作者 Hong Qian Jianmin Pang Jinlong Xu Yapeng Li 《国际计算机前沿大会会议论文集》 2021年第1期163-179,共17页
The leading way to achieve thread-level parallelism on the Sunwayhigh-performance multicore processors is to use OpenMP programming techniques.In order to address the problem of low parallel efficiency caused by hight... The leading way to achieve thread-level parallelism on the Sunwayhigh-performance multicore processors is to use OpenMP programming techniques.In order to address the problem of low parallel efficiency caused by highthread group control overhead in the compilation of Sunway OpenMP programs,this paper proposes the parallel region reconstruction technique. The parallelregion reconstruction technique expands the parallel scope of parallel regionsin OpenMP programs by parallel region merging and parallel region extending.Moreover, it reduces the number of parallel regions in OpenMP programs,decreases the overhead of frequent creation and convergence of thread groups,and converts standard fork-join model OpenMP programs to higher performanceSPMD modelOpenMP programs. On the Sunway 1621 server computer, NPB3.3-OMP and SPEC OMP2012 achieved 8.9% and 7.9% running efficiency improvementrespectively through parallel region reconstruction technique. As a result,the parallel region reconstruction technique is feasible and effective. It providestechnical support to fully exploit the multi-core parallelism advantage of Sunway’shigh-performance processors. 展开更多
关键词 Sunway high-performance multi-core processors openmp programming technique Parallel domain reconstruction technique
原文传递
Thread Private Variable Access Optimization Technique for Sunway High-Performance Multi-core Processors
13
作者 Jinying Kong Kai Nie +2 位作者 Qinglei Zhou Jinlong Xu Lin Han 《国际计算机前沿大会会议论文集》 2021年第1期180-189,共10页
The primary way to achieve thread-level parallelism on the Sunwayhigh-performance multicore processor is to use the OpenMP programming technique.To address the problem of low parallelism efficiency caused by slow acce... The primary way to achieve thread-level parallelism on the Sunwayhigh-performance multicore processor is to use the OpenMP programming technique.To address the problem of low parallelism efficiency caused by slow accessto thread private variables in the compilation of Sunway OpenMP programs, thispaper proposes a thread private variable access technique based on privilegedinstructions. The privileged instruction-based thread-private variable access techniquecentralizes the implementation of thread-private variables at the compilerlevel, eliminating the model switching overhead of invoking OS core processingand improving the speed of accessing thread-private variables. On the Sunway1621 server platform, NPB3.3-OMP and SPEC OMP2012 achieved 6.2% and6.8% running efficiency gains, respectively. The results show that the techniquesproposed in this paper can provide technical support for giving full play to theadvantages of Sunway’s high-performance multi-core processors. 展开更多
关键词 Sunway high-performance multi-core processors openmp programming technique Privileged instruction-based thread-private variable access technique Sunway 1621 processor
原文传递
地下水数值模拟中P-PCG并行子程序包的改进 被引量:2
14
作者 黄林显 邵景力 +2 位作者 崔亚莉 李玲 程汤培 《湖南科技大学学报(自然科学版)》 CAS 北大核心 2012年第2期83-87,共5页
在详细分析MODFLOW中P-PCG并行子程序包设计原理的基础上,针对其对层数较少模型加速效果不理想的特点提出了改进方案.在对同一算例数值模型的测试中,P-PCG并行子程序包加速比可以达到1.6,而改进后的P-PCG并行子程序包最大加速比可以达到... 在详细分析MODFLOW中P-PCG并行子程序包设计原理的基础上,针对其对层数较少模型加速效果不理想的特点提出了改进方案.在对同一算例数值模型的测试中,P-PCG并行子程序包加速比可以达到1.6,而改进后的P-PCG并行子程序包最大加速比可以达到3.2,明显提高了地下水数值模型的运行速度. 展开更多
关键词 地下水数值模拟 openmp技术 并行计算 P-PCG并行子程序包
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部