异构GPU集群的任务调度方法研究及实现被引量：7

Research and Implementation of Task Schedule Method on Heterogeneous GPU Cluster

下载PDF

导出

摘要 GPU集群已经成为高性能计算的重要方式,特别对于计算密集型应用,具有成本低、性能高、功耗小的优势。为了解决GPU集群系统运行中的任务负载均衡问题,文中提出了一种面向计算密集型应用的异构GPU集群调度方法,该方法可以自动发现计算节点,并动态估计计算节点的计算能力,并根据计算能力、任务的计算强度和优先级在异构GPU集群上合理分配计算资源。同时,该系统还具有容错能力,能够处理计算节点的意外退出,可恢复意外退出计算节点的计算任务,并动态适应系统的计算规模。通过实验表明,文中采用的策略达到了预期目的。 GPU cluster has become an important method for high performance computing, especially for compute-intensive applications. It has many advantages, such as low cost, high performance and low power consumption. To solve the load balancing problem of GPU cluster system, propose an algorithm for heterogeneous GPU cluster, it can automatically identify computation nodes, dynamically estimate the computing capability of these nodes and allocate resources in heterogeneous GPU cluster based on computation nodes＂ capability, tasks , computing strength and priority. At the same time, the system is also fault tolerant, which is able to handle unexpected exit of computa- tion nodes, recover the computing task of calculation nodes out of an unexpected exit and dynamically adapt to the calculation size of the system. The experiment result shows this strategy achieves desired purpose.

作者黄锦增陈虎赖路双

机构地区华南理工大学软件学院

出处《计算机技术与发展》 2012年第5期32-36,共5页 Computer Technology and Development

关键词负载均衡异构GPU集群任务调度动态适应 load balance heterogeneous GPU cluster task schedule dynamical adaptation

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1BuyyaR.高性能集群计算:结构与系统[M].郑纬民,石威,译.北京:电子工业出版社,2001.
2陈华平,黄刘生,安虹,陈国良.并行分布计算中的任务调度及其分类[J].计算机科学,2001,28(1):45-48. 被引量：8
3李丙锋,祝永志,魏榕晖.异构Beowulf系统负载均衡技术的研究与实现[J].计算机技术与发展,2008,18(7):60-62. 被引量：4
4徐群,祝永志.集群系统中的负载均衡问题的研究[J].计算机技术与发展,2009,19(8):129-132. 被引量：10
5陈志刚,曾志文.中间应用服务器动态负载均衡的物理模型[J].计算机工程,2001,27(1):44-45. 被引量：10
6王霜,修保新,肖卫东.Web服务器集群的负载均衡算法研究[J].计算机工程与应用,2004,40(25):78-80. 被引量：46
7Werstein P,Situ H,Huang Zhiyi. Load Balancing in a Cluster Computer[ C ]//Proceedings of the Seventh International Con- ference on Parallel and Distributed Computing Applications and Technologies. [s. 1. ]:[s. n. ] ,2006.
8Chi M, Yu Jung- Lok, Kim Ho- Joong, et al. Improving Per- formance of a Dynamic Load Balancing System by Using Num- ber of Effective Tasks[ C ]//IEEE International Conference on Cluster Computing Proceedings 2003. [s. 1. ] : [s. n. ] ,2003: 436-441.
9Tanenbaum A S. Distributed Operating Systems [ M ]. Engle- wood Cliffs, New Jersey : Prentice-Hall, 1995.
10Kunz T. The influence of different workload descriptions on a heuristic load balancing scheme [ J ]. IEEE Transactions on Software Engineering, 1991,17 ( 7 ) :725-730.

二级参考文献16

1陈华平,林洪,陈国良.并行分布计算中的启发式任务调度[J].计算机研究与发展,1997,34(S1):81-85. 被引量：4
2陆鑫达,郑飞.异构并行计算及其调度策略[J].计算机工程,1997,23(S1):37-39. 被引量：1
3王霜,修保新,肖卫东.Web服务器集群的负载均衡算法研究[J].计算机工程与应用,2004,40(25):78-80. 被引量：46
4肖辽亮.NAT-PT簇负载平衡的设计与实现[J].计算机技术与发展,2006,16(3):80-82. 被引量：4
5张坚,刘春林,谭庆平.一种分布式工作流中基于负载平衡的调度算法[J].计算机科学,2006,33(7):115-118. 被引量：7
6Dahlin M.Interpreting Stale Load Information[C].In:Proc of the 19th Intl Conf on Distributed Computing Systems, 1999-05
7Mitzenmacher M.How Useful is Old Information[C].In:Proc of the 15th Annual ACM
8Cenova Z,Christensen K J.Chanllenges In :URL Switching for Implementing Globally Distributed Web Sites[C].In:Proc of the Workshop on Scalable Web Services,2000-08:89～94
9刘必雄,许榕生.大规模文件上传接收服务的负载均衡引擎研究[J].计算机技术与发展,2008,18(6):16-19. 被引量：2
10陈华平,计永昶,陈国良.分布式动态负载平衡调度的一个通用模型[J].软件学报,1998,9(1):25-29. 被引量：42

共引文献72

1杨会元,冯钟葵,李山山.基于Web的遥感影像在线分类实现技术研究[J].遥感信息,2015,30(1):101-106. 被引量：5
2熊庆文,边馥苓.以应用服务器为中心的GIS多层体系结构研究[J].测绘信息与工程,2005,30(1):20-22. 被引量：6
3吕西红,陈志刚,曾碧卿,曾志文.三层客户/服务计算技术研究及其应用[J].计算机工程与应用,2005,41(34):120-123. 被引量：1
4郑毅强,郭荷清,高伟,林满山.基于业务组件划分的多集群体系结构[J].计算机工程,2006,32(6):112-114. 被引量：1
5吴璇,隋红建.提高防火墙集群效率的分散式均衡算法及实现[J].计算机工程与设计,2006,27(12):2218-2219. 被引量：1
6吴璇,隋红建.分布式均衡算法在防火墙集群中的实现[J].计算机系统应用,2006,15(8):28-30. 被引量：1
7邱钊,陈明锐.Web集群负载均衡算法比较[J].现代计算机,2006,12(8):61-63. 被引量：6
8陈明锐,邱钊,黄曦,黄俊.智能负载均衡技术在高负荷网站上的应用[J].广西师范大学学报（自然科学版）,2006,24(4):243-246. 被引量：4
9邱钊,卢春燕,陈明锐,黄俊.普通高考招生信息网站的负载均衡[J].计算机工程与应用,2007,43(11):213-215. 被引量：2
10张昊,廖建新,朱晓民.增强型动态反馈随机分发负载均衡算法[J].计算机工程,2007,33(4):97-99. 被引量：13

同被引文献69

1李军红,周天瑞,郑荣.模拟退火—改进遗传算法及其应用[J].南昌大学学报（理科版）,2005,29(4):387-390. 被引量：6
2韩瑞新,刘小江,朱红胜,祝笑舟.基于光栅扫描的雷达显示系统仿真[J].计算机仿真,2005,22(11):24-27. 被引量：10
3赖青梧,谢剑英,叶小丽.混沌模拟退火最短路由算法的事后处理技术[J].南昌大学学报（理科版）,2006,30(2):198-200. 被引量：1
4陈柏生.一种二值图像连通区域标记的新方法[J].计算机工程与应用,2006,42(25):46-47. 被引量：60
5徐正光,鲍东来,张利欣.基于递归的二值图像连通域像素标记算法[J].计算机工程,2006,32(24):186-188. 被引量：72
6刘贤喜,李邦明,苏庆堂,刘中合,王玉亮,杨峰.一种新的二值图像连通区域准确标记算法[J].计算机工程与应用,2007,43(22):76-78. 被引量：20
7Fedorova A, Saez J C, Shelepov D, et al, Maximizing power efficiency with asymmetric multicore systems[J]. Communi cations of the ACM, 2009, 52(12):48-57.
8Kumar R, Farkas K I, Jouppi N P, et al. Single-ISA hetero- geneous multi-core architectures: The potential for processor power reduction[C]//Proc of the 36th Annual IEEE/ACM International Symposium on Microarchitecture, 2003:81 -92.
9Li T, Baumherger D, Koufaty D A, et al. Efficient operat ing system scheduling for performance asymmetric multi-core architectures[C]//Proc of 2007 ACM/IEEE Conference on Supercomputing, 2007 : 1-11.
10Koufaty D, Reddy D, Hahn S. Bias scheduling in heteroge- neous multi core architectures[C]//Proc of the 5th European Conference on Computer Systems, 2010:125 -138.

引证文献7

1徐远超,谭旭,范灵俊,孙卫真,张志敏.性能不对称多核处理器负载均衡调度研究[J].计算机工程与科学,2013,35(11):80-86. 被引量：3
2肖旭,慕德俊,张慧翔,陈春雷.GPU加速的贝叶斯网络精确推理方法研究[J].计算机技术与发展,2014,24(10):1-5.
3汪群雄,牛晨辉,田海俊,吴锋泉,李吉夏,陈学雷,蒿杰.基于ROACH2-GPU的集群相关器研究——X-engine模块的设计与实现[J].天文研究与技术,2016,13(2):219-227. 被引量：2
4王文豪,周静波,高尚兵,蒋道霞.集群系统任务调度算法[J].南昌大学学报（理科版）,2016,40(4):403-408.
5郑占东,马骏.气溶胶光学厚度遥感反演查找表的快速构建[J].计算机应用研究,2018,35(10):3155-3157.
6甘晓英,白阳,何晓栋,刘斌.一种并行二值图像连通域标记算法[J].计算机与数字工程,2021,49(5):993-997. 被引量：11
7胡昌秀,张仰森,彭爽,陈涵,祁浩家.异构分布式深度学习平台的构建和优化方法研究[J].重庆理工大学学报（自然科学）,2023,37(9):208-216. 被引量：2

二级引证文献18

1严飞,肖雨倩,路长秋,文杰,刘佳.基于二值条纹三维测量的相位补偿方法[J].电子测量技术,2023,46(21):143-150.
2李继标,柳明贤,赵李强.一种基于全局搜索的二值图像连通域标记方法[J].云南电业,2024(2):37-41.
3牛晨辉,汪群雄,郑小平,田海俊,吴锋泉,李吉夏,陈学雷,蒿杰.基于ROACH2-GPU集群相关器的研究--F-engine模块的设计与实现[J].天文研究与技术,2017,14(1):60-69. 被引量：1
4姚丽莎,王占凤,程家兴.分层混合局部搜索策略异构多核系统调度[J].运筹与管理,2017,26(8):193-199. 被引量：1
5晋高成,李丕丁.异构多核调度算法研究综述[J].软件导刊,2021,20(2):238-243. 被引量：2
6卢其伦,闫奕樸,张圆明,陈敏怡,汤梓玥.基于机器视觉的燃气表表观缺陷自动检测方法[J].计量与测试技术,2022,49(7):54-56. 被引量：1
7王正行,位门,李雷,胡楷,朱鸿泰.面向CPU的实时二值图像连通域标记方法[J].单片机与嵌入式系统应用,2023,23(1):39-41. 被引量：1
8林婉怡,穆瑞珍,李浩杰,李俊杰.基于光导航的无线充电小车设计[J].电工技术,2023(4):22-24.
9吴士好,刘艳华.基于MATLAB/GUI的文字图片识别系统设计[J].电子产品世界,2023,30(4):18-19. 被引量：2
10吴杰,董小涛,张珂,李曦,吴南.基于高分一号卫星数据的库区淹没频率分析方法[J].河海大学学报（自然科学版）,2023,51(5):9-14. 被引量：3

1盛冲冲,胡新明,李佳佳,吴百锋.面向节点异构GPU集群的编程框架[J].计算机工程,2015,41(2):292-297. 被引量：3
2霍洪鹏,胡新明,盛冲冲,吴百锋.面向节点异构GPU集群的能量有效调度方案[J].计算机应用与软件,2013,30(3):283-286. 被引量：1
3李佳佳,胡新明,吴百锋.基于异构GPU集群的并行分布式编程解决方案[J].计算机应用与软件,2014,31(9):28-31. 被引量：1
4刘芳,邓笋根,聂宁明,王彦棡,王珏.克希霍夫时间偏移在GPU集群上的MPI/CUDA混合编程实现[J].科研信息化技术与应用,2012,3(5):34-41. 被引量：2
5龙赛琴,赵跃龙,谢晓玲,陈伟,曾文英.面向大规模存储系统的静态文件布局策略[J].华南理工大学学报（自然科学版）,2013,41(1):70-76. 被引量：1

计算机技术与发展

2012年第5期

浏览历史

内容加载中请稍等...

异构GPU集群的任务调度方法研究及实现被引量：7

参考文献12

二级参考文献16

共引文献72

同被引文献69

引证文献7

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

异构GPU集群的任务调度方法研究及实现 被引量：7

参考文献12

二级参考文献16

共引文献72

同被引文献69

引证文献7

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

异构GPU集群的任务调度方法研究及实现被引量：7