期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向规则DOACROSS循环的流水并行代码自动生成 被引量:3
1
作者 刘晓娴 赵荣彩 +1 位作者 赵捷 徐金龙 《软件学报》 EI CSCD 北大核心 2014年第6期1154-1168,共15页
发掘DOACROSS循环中蕴含的并行性,选择合适的策略将其并行执行,对提升程序的并行性能非常重要.流水并行方式是规则DOACROSS循环并行的重要方式.自动生成性能良好的流水并行代码是一项困难的工作,并行编译器对程序自动并行时常常对DOACR... 发掘DOACROSS循环中蕴含的并行性,选择合适的策略将其并行执行,对提升程序的并行性能非常重要.流水并行方式是规则DOACROSS循环并行的重要方式.自动生成性能良好的流水并行代码是一项困难的工作,并行编译器对程序自动并行时常常对DOACROSS循环作保守处理,损失了DOACROSS循环包含的并行性,限制了程序的并行性能.针对上述问题,设计了一种选择计算划分循环层和循环分块层的启发式算法,给出了一个基于流水并行代价模型的循环分块大小计算公式,并使用计数信号量进行并行线程之间的同步,实现了基于OpenMP的规则DOACROSS循环流水并行代码的自动生成.通过对有限差分松弛法(finite difference relaxation,简称FDR)的波前(wavefront)循环和时域有限差分法(finite difference time domain,简称FDTD)中典型循环以及程序Poisson,LU和Jacobi的测试,算法自动生成的流水并行代码能够在多核处理器上获得明显的性能提升,使用的流水分块大小计算公式能够较为精确地计算出循环流水并行时的最佳分块大小.自动生成的流水并行代码与基于手工选择的最优分块大小的流水并行代码相比,加速比达到手工选择加速比的89%. 展开更多
关键词 流水并行 自动并行 doacross循环 代价模型
在线阅读 下载PDF
一种面向规则DOACROSS循环的自动并行化框架
2
作者 张庆花 赵荣彩 李朋远 《小型微型计算机系统》 CSCD 北大核心 2016年第6期1365-1370,共6页
针对现有编译器对DOACROSS循环采取保守处理而造成程序并行性巨大损失的问题,本文提出了一种面向规则DOACROSS循环的自动并行框架.首先基于依赖测试提出了同步距离求解算法以确定嵌套循环的并行层、迭代分组层,以及同步语句插入点;其次... 针对现有编译器对DOACROSS循环采取保守处理而造成程序并行性巨大损失的问题,本文提出了一种面向规则DOACROSS循环的自动并行框架.首先基于依赖测试提出了同步距离求解算法以确定嵌套循环的并行层、迭代分组层,以及同步语句插入点;其次提出了明确的同步控制机制来实现不同线程间的通信;最后,本文设计了一种基于程序执行开销的流水粒度求解算法,以达到降低程序并行过程中的同步开销目的.本文将该方法在SW-VEC自动并行化系统中实现并加以验证,实验结果表明本文所提方法对FDR波前计算循环和NPB3.3.1中的LU课题有明显性能提升. 展开更多
关键词 doacross循环 流水并行 同步距离 同步控制机制 流水粒度
在线阅读 下载PDF
面向非规则Doacross循环的反馈式编译框架
3
作者 张庆花 赵荣彩 +2 位作者 张素平 丁丽丽 王鹏翔 《信息工程大学学报》 2018年第1期100-105,共6页
非规则Doacross循环包含复杂数据流以及控制流引起的不确定依赖关系,传统并行化技术对其采取保守处理,错失不少并行机会。文章提出一种面向非规则Doacross循环的反馈式编译方法,利用程序运行时的剖面信息指导自动并行化工具进行并行化... 非规则Doacross循环包含复杂数据流以及控制流引起的不确定依赖关系,传统并行化技术对其采取保守处理,错失不少并行机会。文章提出一种面向非规则Doacross循环的反馈式编译方法,利用程序运行时的剖面信息指导自动并行化工具进行并行化。通过插桩和试运行的方式得到程序的上下文信息,反馈给并行化工具,利用反馈信息构建程序依赖图,进而对程序进行并行化。实验结果表明该方法对测试用例有明显的性能提升。 展开更多
关键词 非规则doacross循环 并行化 插桩 试运行 反馈
在线阅读 下载PDF
Revisiting the Parallel Strategy for DOACROSS Loops 被引量:1
4
作者 Song Liu Yuan-Zhen Cui +3 位作者 Nian-Jun Zou Wen-Hao Zhu Dong Zhang Wei-Guo Wu 《Journal of Computer Science & Technology》 SCIE EI CSCD 2019年第2期456-475,共20页
DOACROSS loops are significant parts in many important scientific and engineering applications,which are generally exploited pipeline/wave-front parallelism by loop transformations.However,previous work almost statica... DOACROSS loops are significant parts in many important scientific and engineering applications,which are generally exploited pipeline/wave-front parallelism by loop transformations.However,previous work almost statically performs iterations in parallel threads,thus causing a waste of computing resources in thread synchronization.This paper proposes a brand-new parallel strategy for DOACROSS loops that provides a dynamic task assignment with reduced dependences to achieve wave-front parallelism through loop tiling.The proposed strategy uses a master-slave parallel mode and some customized structures to realize dynamic and flexible parallelization,which effectively avoids threads from waiting in communication.An efficient tile size selection(TSS)approach is also proposed to preserve data reuse in cache for tiled codes.The experimental results show that the proposed parallel strategy obtains good and stable speedups over six typical benchmarks with different problem sizes and different numbers of threads on an Intel■Xeon■32-core serve?.And it outperforms two static strategies,a barrier-based strategy and a post/wait-based strategy,by 32% and 20% in average performance,respectively.This strategy also yields a better performance than a mutex-based dynamic strategy.Besides,it has been demonstrated that the proposed TSS approach can achieve a near-optimal performance and is comparable with a state-of-the-art TSS approach. 展开更多
关键词 doacross LOOP WAVE-FRONT PARALLELISM TILE size selection dynamic task ASSIGNMENT synchronization optimization
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部