克希霍夫时间偏移在GPU集群上的MPI/CUDA混合编程实现被引量：2

A Hybrid MPI/CUDA Implementation of Kirchhoff Time Migration on Multi-GPU Clusters

导出

摘要本文介绍了二维／三维克希霍夫时间偏移计算在GPU集群上的MPI／CUDA混合编程实现。系统的主体结构基于经典的主从模式，采用MPI进程-pthread线程-CUDA线程三个层次的并行架构，以及CPU／GPU协同计算并行架构和策略来设计实现。每个计算节点由一个多核CPU和多个GPU设备组成。输入数据在主节点上载入，平均分配到从节点上，存储到相应的磁盘空间内，并根据各节点的可用资源将数据划分为多块。每个从节点分别接收主节点发送的数据并存储到本地磁盘上的临时文件内。根据检测到的可用GPU设备数，每个从节点上创建同样数目的线程来一对一控制各个GPU。各从节点上每个数据块再进一步划分为大小相等的块一一分配给各个线程，由每个线程逐道在CPU上预处理后传送到GPU上处理，道内的各成像点分别由各CUDA线程并行处理。每个数据块偏移由每个线程内的相关道累加计算而得，结果返回到主节点上累加后输出到磁盘文件内。在实现过程中，采用CPU／GPU协同计算以及线}生插值走时的方式来进一步提高性能。系统性能在一典型异构GPU集群上测试，每个节点由一个配置8GB内存的四核CPU，以及配置6GB显存的C1060型号的GPU组成。对于不同的规模和积分计算模式，在该平台上的测试结果表明，本文实现的系统的性能对于包含相同计算节点数、每个节点上4个线程并行计算的MPI版本，可以达到平均约5～10倍的加速。 We present a hybrid system for accelerating 2D/3D Kirchhoff time migration on multi-GPU clusters using MPI and CUDA. The system is implemented using CPU/GPU cooperation based on a typical masterslave mode. It is mapped to three levels： MPI process--pthread--CUDA thread. Each computing node is composed of a many-core CPU augmented with multiple GPUs. The input data is equally distributed by master node among slave nodes, and divided into canvas blocks according to the available resources on the slave nodes. The data is received by slaved nodes and stored into local disk files. Threads with the same number as the detected GPU devices are generated to one-to-one control the GPUs on each slave node. The canvas block is equally sub-divided into trace blocks for those threads to deal with trace by trace on GPU after preprocess on CPU. The image points of the output are processed by CUDA threads in parallel. The compute result of each canvas is contributed by all the related traces of each thread and is sent back to the master node for accumulation before output to disk files. During implementation, we improved the performance by CPU/GPU cooperation and linear exploration of the travel time. The results and performance of our system are analyzed on a typical multi-GPU cluster. Each computing node consists of a Quad-core CPU with 8GB memory, and two C1060 GPUs with 6GB memory. For different scales and integral modes, experimental results show that our hybrid system finally gains about 5-10 speedup in comparison to the multi-thread version of the system on the same platform, with the same number of nodes and 4 threads on each slave node.

作者刘芳邓笋根聂宁明王彦棡王珏

机构地区中国科学院计算机网络信息中心超级计算中心

出处《科研信息化技术与应用》 2012年第5期34-41,共8页 E-science Technology & Application

基金中国科学院科研信息化应用推进工程项目(XXH12503)

关键词地震勘探资料数据处理克希霍夫时间偏移协同计算 MPI CUDA Seismic data processing Kirchhoff Time Migration CPU/GPU cooperation MPI CUDA

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1赵改善.地球物理高性能计算的新选择:GPU计算技术[J].勘探地球物理进展,2007,30(5):399-404. 被引量：23
2李肯立,彭俊杰,周仕勇.基于CUDA的Kirchhoff叠前时间偏移算法设计与实现[J].计算机应用研究,2009,26(12):4474-4477. 被引量：14
3Ye Yueming,Li Zhenchun,Han Wengong,Liu Qingmin.Beamlet prestack depth migration and illumination： A test based on the Marmousi model[J].Applied Geophysics,2006,3(4):203-209. 被引量：5
4刘国峰,刘洪,王秀闽,孟小红.Kirchhoff积分时间偏移的两种走时计算及并行算法[J].地球物理学进展,2009,24(1):131-136. 被引量：32
5邹振,刘洪,刘红伟.Kirchhoff叠前时间偏移角度道集[J].地球物理学报,2010,53(5):1207-1214. 被引量：26

二级参考文献80

1李伟东,赵改善,韦海亮,谢向辉,王于静,周会庆,庞世明.网格计算技术在石油勘探开发中的应用[J].微电子学与计算机,2006,23(Z1):196-198.
2陈凌,吴如山,王伟君.基于Gabor-Daubechies小波束叠前深度偏移的角度域共成像道集[J].地球物理学报,2004,47(5):876-885. 被引量：24
3吴时国,王秀玲,季玉新,刘玉珍,韩文功.3Dmove构造裂缝预测技术在古潜山的应用研究[J].中国科学（D辑）,2004,34(9):818-824. 被引量：26
4吴明华,吴清岭,李文艳.叠前深度偏移资料解释方法研究[J].石油物探,2004,43(4):331-336. 被引量：8
5罗银河,刘江平,董桥梁,范向勇.Kirchhoff弯曲射线叠前时间偏移及应用[J].天然气工业,2005,25(8):35-37. 被引量：28
6赵改善,李剑峰,王于静,韦海亮.网格计算技术及其在石油勘探开发中的应用前景[J].石油物探,2005,44(5):413-420. 被引量：12
7凌云,高军,孙德胜,林吉祥.针对不同地质目标的叠前时间偏移成像解释评价[J].石油物探,2006,45(3):217-229. 被引量：3
8刘洪,袁江华,陈景波,首皓,李幼铭.大步长波场深度延拓的理论[J].地球物理学报,2006,49(6):1779-1793. 被引量：39
9Ye Yueming,Li Zhenchun,Han Wengong,Liu Qingmin.Beamlet prestack depth migration and illumination： A test based on the Marmousi model[J].Applied Geophysics,2006,3(4):203-209. 被引量：5
10李景叶,陈小宏,芮振华.基于匹配滤波的多次波压制方法研究[J].地球物理学进展,2007,22(1):200-206. 被引量：23

共引文献85

1刘伟峰,赵改善,孔祥宁,蔡杰雄,张兵.基于多GPU的三维Kirchhoff积分法体偏移[J].华中科技大学学报（自然科学版）,2011,39(S1):110-114. 被引量：2
2李佩,朱生旺,宁俊瑞,王永胜.等效偏移距叠前时间偏移及其在塔河地区应用[J].物探与化探,2013,37(6):1120-1124. 被引量：1
3杨敬磊,李振春,叶月明,潘雅婷.地震照明叠前深度偏移方法综述[J].地球物理学进展,2008,23(1):146-152. 被引量：13
4王宏琳.计算机前沿技术在地球物理中的应用——下一代地震计算机将会是什么样子?[J].勘探地球物理进展,2008,31(6):419-426. 被引量：3
5张兵,赵改善,黄骏,李敏,刘伟峰.地震叠前深度偏移在CUDA平台上的实现[J].勘探地球物理进展,2008,31(6):427-432. 被引量：16
6李军,李艳辉,陈双平.CUDA架构下的快速图像去噪[J].计算机工程与应用,2009,45(11):183-185. 被引量：12
7王宏琳.地球物理计算机的变革[J].勘探地球物理进展,2009,32(4):233-238. 被引量：2
8张廉萍,刘洪.基于成像射线的偏移剖面和速度时深转换评述[J].地球物理学进展,2009,24(5):1703-1709. 被引量：4
9李肯立,彭俊杰,周仕勇.基于CUDA的Kirchhoff叠前时间偏移算法设计与实现[J].计算机应用研究,2009,26(12):4474-4477. 被引量：14
10杜歆,颜瑞,刘加海.监控摄像机视频去隔行和CUDA加速[J].传感技术学报,2010,23(3):393-398. 被引量：5

同被引文献12

1王棣,王华忠,马在田,王立歆.叠前时间偏移方法综述[J].勘探地球物理进展,2004,27(5):313-320. 被引量：72
2刘兆春,李光辉,王庆国,柴守海.并行文件系统PVFS[J].信息技术,2005,29(4):108-109. 被引量：2
3曹国滨,张旭,张加海.叠前成像方法联合应用与配套处理技术分析[J].勘探地球物理进展,2005,28(5):305-308. 被引量：8
4刘天华,朱宏峰,杜梅,常桂然.RDMA技术的研究与应用[J].沈阳师范大学学报（自然科学版）,2006,24(2):185-188. 被引量：5
5樊卫花,杨长春,孙传文,刘文卿.三维地震资料叠前时间偏移应用研究[J].地球物理学进展,2007,22(3):836-842. 被引量：44
6卢照,张锦娟,师军,鱼佳欣.MPI动态负载平衡策略的研究与实现[J].计算机技术与发展,2010,20(5):132-135. 被引量：7
7陈辉,孙雷鸣,李录明,罗省贤,赵安军.基于MPI+OpenMP的多层次并行偏移算法研究[J].成都理工大学学报（自然科学版）,2010,37(5):528-534. 被引量：8
8邓笋根,迟学斌,刘芳,聂宁明,王彦棡.数据流软件Flobus在地震勘探资料处理中的应用[J].科研信息化技术与应用,2011,2(6):83-91. 被引量：1
9张锦涛,赵惊涛,王真理.FPGA与GPU并行计算分析——以Kirchhoff叠前时间偏移为例[J].地球物理学进展,2013,28(3):1464-1471. 被引量：7
10李振春.地震偏移成像技术研究现状与发展趋势[J].石油地球物理勘探,2014,49(1):1-21. 被引量：86

引证文献2

1王刚,唐杰,武港山.基于多GPU集群的编程框架[J].计算机技术与发展,2014,24(1):9-13. 被引量：3
2邓笋根.克希霍夫偏移成像分块策略对文件I/O的影响[J].科研信息化技术与应用,2014,5(5):25-29.

二级引证文献3

1金野,高珏,王磊,许华虎.基于邻域光流路径插帧算法的改进[J].计算机技术与发展,2015,25(3):11-14.
2徐恒,吴俊敏,杨志刚,尹燕.基于虚拟化环境的多GPU并行通用计算平台研究[J].计算机应用与软件,2017,34(11):74-80. 被引量：3
3杨志刚,吴俊敏,徐恒,尹燕.基于虚拟化的多GPU深度神经网络训练框架[J].计算机工程,2018,44(2):68-74. 被引量：10

1苏武,王命延,童星,邵风瑞.基于时间同步的动态口令身份认证的研究[J].计算机与现代化,2009(10):185-187. 被引量：1
2平一帆,张海林,王皓.一种新型OFDM系统频率和时间同步算法[J].电子元器件应用,2006,8(7):84-86.
3姜帆,郑霖.无线传感器网络TPSN-RBS联合时间同步算法[J].传感器与微系统,2016,35(1):149-152. 被引量：8
4刘奇琳,黄跃,唐建明,甘其刚.波动方程叠前深度偏移的GPU技术[J].物探化探计算技术,2010,32(4):386-391. 被引量：6
5黄锦增,陈虎,赖路双.异构GPU集群的任务调度方法研究及实现[J].计算机技术与发展,2012,22(5):32-36. 被引量：7
6任宇子.Intel四核CPU本月面市[J].中国计算机用户,2006(43):11-11.
7性能提升扩展丰富华硕DSEB-DG双路服务器主板[J].计算机与网络,2008,34(1):52-52.
8阿龙.给力娱乐平台——四核独显家用电脑导购[J].电脑知识与技术（经验技巧）,2012(4):67-69.
9新闻新品[J].电脑爱好者,2008(24):103-104.
10靖程.三星GT-I9050（移动版）智能手机稳定的双核体验[J].电脑时空,2012(7):32-32.

科研信息化技术与应用

2012年第5期

浏览历史

内容加载中请稍等...

克希霍夫时间偏移在GPU集群上的MPI/CUDA混合编程实现被引量：2

参考文献5

二级参考文献80

共引文献85

同被引文献12

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

克希霍夫时间偏移在GPU集群上的MPI/CUDA混合编程实现 被引量：2

参考文献5

二级参考文献80

共引文献85

同被引文献12

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

克希霍夫时间偏移在GPU集群上的MPI/CUDA混合编程实现被引量：2