基于MPI+CUDA环境的静电相互作用能并行求解被引量：1

PARALLEL SOLVING ELECTROSTATIC INTERACTION ENERGY BASED ON MPI+CUDA ENVIRONMENT

下载PDF

导出

摘要 ABEEMσπ(Atom-Bond Electronegativity EqualizationσπModel)模型中,原串行程序求静电相互作用能的方法非常耗时,致使研究问题的效率降低。针对原程序中多个循环相互嵌套的求解部分,采用带状卷帘存储迭代分配的MPI(Message Passing Inter-face)并行化处理;对体系中所有原子、σ键、孤对电子、π键位点之间的静电相互作用能采用多线程CUDA(Computer Unified DeviceArchitecture)并行化处理。传统MPI+CUDA环境中,GPU和CPU之间的数据传输开销大,导致整体性能下降以及各种粒子间计算串行调用CUDA,致使时间浪费。针对上述情况,使用GPU核心的缓存机制解决传输开销大的问题,并利用多CUDA流技术实现多个循环异步进行计算,从而缩短了运行时间。然后选取多个不同类型的大分子体系进行测试,结果表明,利用改进的MPI+CUDA并行模型进行动力学模拟,并行加速比显著提高,大幅度缩减了求解静电相互作用能的时间,并得到与串行一致的结果。 In ABEEMσπ model, original serial program consumes much time in seeking electrostatic interaction energy, which caused the research inefficient. In solution part of the original program, as the multiple loops are nested each other, MPI parallel processing of strip rolling storage iterative distribution is adopted to resolve this problem; and, multi-threaded CUDA parallel processing is used to deal with the static sites interactions among all the atoms, σ bond, lone pair electrons and ,π bond in the system. In traditional environment of MPI ＋ CUDA, there is huge spending when data transferring between GPU and CPU, which results in overall performance decrease and the calculation of serial called CUDA between a variety of particles, therefore leads to time wasted. For these above, this paper proposes that applying the mechanism of the GPU core caching to solve the problem of huge transmission cost, and making use of multi-stream technology of CUDA to realise multiple cycles asynchronous for calculation, so that the running time will be reduced. Then, several systems of different types of macromolecular are selected to test, the result shows, by applying modified MPI ＋ CUDA parallel model in dynamics simulation, the parallel speedup improves significantly, the time of solving the electrostatic interaction energy reduces substantially, while results are identical to the serial program.

作者刘青昆马名威杨荣杰宫利东

机构地区辽宁师范大学计算机与信息技术学院辽宁师范大学化学化工学院

出处《计算机应用与软件》 CSCD 北大核心 2012年第11期35-38,共4页 Computer Applications and Software

基金国家自然科学基金项目(21133005 20703022 21011120087)

关键词原子-键电负性均衡σπ模型静电子相互作用能并行计算消息传递接口统一计算设备架构 ABEEMσπ model Electrostatic interaction energy Parallel computing MPI CUDA

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献8

1杨忠志,叶元杰,唐敖庆.大分子体系的量子化学[M].吉林大学出版社,2005.
2Yang Z Z, Wang C S. Atom-Bond Eleetronegativity Equalization Method and its Applications Based on Density Functional Theory [ J ]. J Theor Comput Chem,2003 ,2 :273 - 299.
3袁景艳,刘方爱,赵芳芳.基于MPI的集群系统的研究[J].信息技术与信息化,2010(2):33-35. 被引量：5
4钱悦.图形处理器CUDA编程模型的应用研究[J].计算机与数字工程,2008,36(12):177-180. 被引量：26
5董荦,葛万成,陈康力.CUDA并行计算的应用研究[J].信息技术,2010,34(4):11-15. 被引量：43
6NVIDIA Corporation. CUDA Programming Guide 2.3 [ M]. 2009.
7Teodoro G, Sachetto R, Sertel O, et al. Coordinating theuse of GPU and CPU for improving performance of compute intensive applications [ C ]//CLUSTER 09 : Proceedings o12009 IEEE Inter-national Conference on Cluster Computing and Workshops. New Or leans, LA : [ s. n. ] , 2009:1 -10.
8刘朝辉,舒继武,郑纬民.基于区域分解和MPI的线性带状方程组归并迭代解法器[J].清华大学学报（自然科学版）,2005,45(10):1409-1412. 被引量：1

二级参考文献22

1盛跃宾,宋晓秋,刘德贵.带状线性方程组的一种有效分布式并行算法[J].系统工程与电子技术,2004,26(7):967-969. 被引量：8
2秦岭,王煜坚,李东新,吴镇扬.视频编码标准H.264的主要技术特点及其应用前景[J].微计算机应用,2004,25(4):449-455. 被引量：25
3Iain E. G. Richardson. H. 264 and MPEG-4 Video Compression: Video Coding for Next Generation Multimedia[R].The Robert Gordon University, Aberdeen, UK
4Joint Video Team of ITU-t and ISO/IEC JTC 1. Draft ITU-T Recommendation and Final Draft International Standard of Joint Video Specification(ITU-T Rec H. 2641 ISO/IEC 14496-10 AVC)[S]. JVT G050, 2003
5JVT-G050. ITU-T Recommendation and Final Draft International Standard of Joint Video Specification[S]. 2003,3
6JVT Official Site[DB/OL]. http://ftp3.itu. ch/ av-arch/jvt-site/ draft_conformance/
7Nvidia Official Site[DB/OL]. http://www. nvidia.com/
8Nvidia, NVIDIA_CUDA_Programming Guide_ 1. 1. pdf , September, 2007
9Richard Gerber, The Software Optimization Cookbook[M].Copyright@Intel Corporation, 2002
10Intel软件说明书(Intel Software manuals)[EB/OL]

共引文献67

1李建璞.基于Gabor滤波特征和一类分类器的人脸检测[J].石家庄铁道学院学报（自然科学版）,2009,22(2):73-77.
2王瑞,梁华,蔡宣平.基于GPU的SIFT特征提取算法研究[J].现代电子技术,2010,33(15):41-43. 被引量：16
3许彦芹,陈庆奎.基于SMP集群的MPI+CUDA模型的研究与实现[J].计算机工程与设计,2010,31(15):3408-3412. 被引量：10
4夏俊峰,杨帆,李静,郑秀玉.基于GPU的电力系统并行潮流计算的实现[J].电力系统保护与控制,2010,38(18):100-103. 被引量：35
5易松,刘福岩,李雪敏,王威,陈业成.基于CUDA平台的海洋表面模拟[J].计算机工程与设计,2011,32(3):998-1001. 被引量：1
6张艳华,刘祥港.一种基于MPI与OpenMP的矩阵乘法并行算法[J].计算机与现代化,2011(7):84-87. 被引量：4
7任军学,李娟,仇钎,汤海滨,温正.离子发动机交换电荷离子返流的粒子模拟[J].强激光与粒子束,2011,23(7):1929-1934. 被引量：4
8谭南,陈辉.基于GPU并行射线跟踪的电波预测算法研究[J].微计算机信息,2011,27(11):104-106. 被引量：1
9刘青昆,马名威,阎慰椿.基于MPI+CUDA异步模型的并行矩阵乘法[J].计算机应用,2011,31(12):3327-3330. 被引量：2
10曾胜田,刘羽,马梦琦.基于CUDA的Prewitt算子并行实现[J].微计算机应用,2011,32(11):71-75. 被引量：3

同被引文献2

1黄凯锋,刘文君.北京某水厂模拟管网内部腐蚀特性分析[J].中国给水排水,2007,23(13):63-65. 被引量：4
2梁党卫,张永哲,李克文,陈振文.子群分层的粗粒度粒子群优化算法[J].计算机工程与设计,2019,40(2):389-393. 被引量：3

引证文献1

1杨周凡,韩林,李冰洋,谢景明,韩璞,刘勇杰.基于“嵩山”超级计算机系统的大规模管网仿真[J].计算机工程,2022,48(9):155-161. 被引量：3

二级引证文献3

1韩璞,商建东,薛飞,谢景明,王洪生,王海.面向国产超算平台的通用能源管网仿真计算模型[J].计算机应用研究,2024,41(3):866-872. 被引量：1
2江治国.基于物联网的水务移动监测平台应用研究[J].齐齐哈尔大学学报（自然科学版）,2024,40(1):27-31. 被引量：1
3商建东,熊威,华浩波,宋昭璐,郭恒亮,张军.面向DCU的流固耦合浸没边界算法异构实现[J].计算机工程,2025,51(7):263-274.

1杜超.基于MPI环境的静电相互作用能并行研究[J].中国电子商务,2012(17):49-49.
2蒋健.中断相互嵌套方法的研究[J].测控技术,1993,12(3):36-38. 被引量：2
3姜华,蒲东兵.Agent及测试床框架描述[J].东北师大学报（自然科学版）,2003,35(3):105-108. 被引量：1
4温钰洪,沈美明,王鼎兴,郑纬民.一种基于Message　Passing的并行程序设计环境[J].软件学报,1995,6(11):647-654.
5刘欣然,胡铭曾.基于Message Passing的并行编程环境[J].计算机工程,1997,23(5):17-20. 被引量：2
6黄国满.等值线三维显示及其并行算法[J].测绘科学,2001,26(2):20-22.
7韩勇,任晓扬.基于PIC单片机空间定位系统的设计[J].仪器仪表用户,2009,16(1):33-34. 被引量：1
8书名号相互嵌套的输入法[J].电脑爱好者,2013(4):45-45.
9ZHENG Peng,CAO Yu,WANG Song.Motion Analysis for Human Interaction Detection Using Optical Flow on Lattice Superpixels[J].Wuhan University Journal of Natural Sciences,2013,18(2):109-116.
10Heng-Song Tang,Wei-Lie Meng,Neng-Hui Zhang.Mechanical properties of double-stranded DNA biofilm with Gaussian distribution[J].Acta Mechanica Sinica,2014,30(1):15-19. 被引量：1

计算机应用与软件

2012年第11期

浏览历史

内容加载中请稍等...

基于MPI+CUDA环境的静电相互作用能并行求解被引量：1

参考文献8

二级参考文献22

共引文献67

同被引文献2

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于MPI+CUDA环境的静电相互作用能并行求解 被引量：1

参考文献8

二级参考文献22

共引文献67

同被引文献2

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于MPI+CUDA环境的静电相互作用能并行求解被引量：1