图形处理器通用计算关键技术研究综述被引量：29

General Purpose Computing of Graphics Processing Unit:A Survey

下载PDF

导出

摘要当前图形处理器的通用计算取得长足发展,为适应通用计算图形处理器在硬件体系结构和软件支持方面完成相应调整和改变,面对各种应用领域中数据规模增大的趋势,多GPU系统和GPU集群的研究应用日趋增多.以流处理器及图形处理器硬件体系为依据,介绍学术和工业领域中流处理器及图形处理器体系变化趋势.从软件编程环境、硬件计算与通信等方面展开讨论,阐述通用计算中图形处理器的关键问题,包括编程模型及语言的发展和方向,存储模型的量化研究、访存模式和行为的优化以及分布式存储管理的热点问题,典型通信原型系统的对比及通信难点的分析,GPU片内和片间的负载均衡,可靠性和容错计算,GPU功耗评测及低功耗优化的研究进展.综述在海量数据处理、智能计算、复杂网络、集群应用领域中图形处理器的研究进展及成果.总结在通用计算发展中存在的技术问题和未来挑战. The General-purpose computing on graphics processing unit has been developing rapidly in recent years.To further improve the General-purpose computing capacity,the graphics processing units have evolved both in the hardware architecture and software support.Aiming at the trend of large-scale data processing emergence in the various application fields,the research about Multi-GPUs system or GPU Clusters also become an urgent research problem.The trend of stream processor and GPUs architecture in the academic and industrial fields is introduced based on the architecture design.The state of the art of key issues in GPGPU are summarized from the programming environment,computing and communication perspectives.It includes the development and the trend of the programming model and the programming languages,the memory model,the accessing patterns and behaviors analysis,the hot issues in the distributed memory management,the comparison and analysis of the existing communication prototype systems,the workload balance on the chip and out of the chip,the reliability model and the fault tolerance,the power consumption measurement and optimization.The currently development and research results of the applications of GPUs are discussed.These application fields are the large-scale data processing,intelligent computing,complex networks and GPUs clusters.Finally,the survey proposes the difficult problems in GPGPU and the new challenges in future.

作者王海峰陈庆奎

机构地区上海理工大学管理学院临沂大学信息学院上海理工大学光电信息与计算机工程学院

出处《计算机学报》 EI CSCD 北大核心 2013年第4期757-772,共16页 Chinese Journal of Computers

基金国家自然科学基金(60970012) 上海市科委重点攻关项目(09511501000 09220502800) 上海市重点学科建设项目(XTKX2012)资助~~

关键词图形处理器通用计算可编程性 GPU集群 graphics processing unit general-purpose computing programmability GPU clusters

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献86

1Yang Xue-Jun, Yan Xiao-Bo, Xing Zuo-Cheng, Deng Yu,Jiang Jiang, Du Jing, Zhang Ying. Fei teng 64 stream pro-cessing system:Architecture,compiler, and programming.IEEE Transactions on Parallel and Distributed Systems,2009,20(8):1142-115.
2吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504. 被引量：141
3吴恩华,柳有权.基于图形处理器(GPU)的通用计算[J].计算机辅助设计与图形学学报,2004,16(5):601-612. 被引量：228
4Owens John D, Luebke D,Govindaraju N,Harris M,Kruger J, Lefohn Aaron E,Purcell Timothy J. A survey ofgeneral purpose computation on graphics hardware. ComputerGraphics Forum, 2007,26(1):80-113.
5Owens John D,Houston M, Luebke D,Green S,Stone John E,Phillips James C. GPU computing:Graphics processing unitspowerful, programmable, and highly parallel are increasinglytargeting general-purpose computing applications. Proceed-ings of the IEEE, 2008? 96(5):879-899.
6Dally W J, Kapasi U J,Mattson P, Namkoong J, OwensJohn D et al. Imagine:Media processing with streams. IEEEMicro, 2008,21(2):35-46.
7Kapasi J, Dally W J,Rixner S, Owens John D,Khailany B.The imagine stream processor//Proceedings of the 2002IEEE International Conference on Computer Design:VLSI inComputers and Processors. Freiburg, Germany, 2002:282-288.
8Dally W J, Labonte F, Das A, HanrahanP, AhnJH,Gum-maraju J, Erez M,Jaasena N,Buck I,Knight J, Kapasi J.Merrimac:Supercomputing with streams//Proceedings of the2003 ACM/IEEE Conference on Supercomputing. Phoenix,Arizona,USA, 2003:35-43.
9伍楠,文梅,何义,荀长庆,任巨,柴俊,张春元.一种流处理器体系结构MASA及其在流体力学计算中的评测[J].计算机学报,2008,31(1):133-141. 被引量：3
10Craig M Wittenbrink, Emmett K,Prabhu Arjun. FermiGF100 GPU architecture. IEEE Micro, 2011, 31(2):50-59.

二级参考文献155

1吴恩华,柳有权.基于图形处理器(GPU)的通用计算[J].计算机辅助设计与图形学学报,2004,16(5):601-612. 被引量：228
2萧蕴诗,李炳宇,吴启迪.求解TSP问题的模式学习并行蚁群算法[J].控制与决策,2004,19(8):885-888. 被引量：20
3吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504. 被引量：141
4王颖,谢剑英.一种自适应蚁群算法及其仿真研究[J].系统仿真学报,2002,14(1):31-33. 被引量：232
5于滨,程春田,杨忠振,谢景新.一种改进的粗粒度并行蚁群算法[J].系统工程与电子技术,2006,28(4):626-629. 被引量：6
6刘立芳,霍红卫,王宝树.PHGA-COFFEE:多序列比对问题的并行混合遗传算法求解[J].计算机学报,2006,29(5):727-733. 被引量：11
7杨学军,高珑.错误流模型:硬件故障的软件传播建模与分析[J].软件学报,2007,18(4):808-820. 被引量：9
8Colorni A,Dorigo M,Maniezzo V,et al.Distributed optimization by ant colonies[C].Proc of 1st European Conf on Artificial Life.Paris,1991:134-142.
9Marcus Randall,Andrew Lewis.A parallel implementation of ant colony optimization[J].J of Parallel and Distributed Computing,2002,62(9):1421-1432.
10Jowens J D,Luebke D,Govindaraju N.A survey of general purpose computation on graphics hardware[C].Euro-Graphics 2005.Dublin,2005:21-51.

共引文献406

1党源源,王昕.CPU-GPU异构系统在光学遥感影像处理中的应用[J].红外与激光工程,2020(S01):177-185. 被引量：9
2何红英,尉朝闻.基于逆滤波法的图像复原技术研究[J].西安文理学院学报（自然科学版）,2009,12(3):92-95. 被引量：1
3刘波,王博亮,谢杰镇.应用于生物膜组织的虚拟手术仿真技术研究[J].中国数字医学,2007,2(11):37-40. 被引量：1
4张军,易成,王邦平,李晓峰.GPU加速的鲁棒性人脸2.5D重建方法[J].四川大学学报（工程科学版）,2009,41(4):155-162.
5刘伟峰,赵改善,孔祥宁,蔡杰雄,张兵.基于多GPU的三维Kirchhoff积分法体偏移[J].华中科技大学学报（自然科学版）,2011,39(S1):110-114. 被引量：2
6刘伟峰,王永胜,张天雷,张兵.使用GPU模拟地震波传播的性能研究[J].系统仿真学报,2009,21(S1):170-174. 被引量：3
7鲍春波,王博亮.基于半边结构的膜组织触觉仿真[J].学术问题研究,2006,0(2):104-109.
8吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504. 被引量：141
9张建勋,刘全利,陈庄.基于可编程GPU的快速体绘制技术[J].重庆大学学报（自然科学版）,2005,28(7):67-70. 被引量：9
10张杨,诸昌钤,何太军.图形硬件通用计算技术的应用研究[J].计算机应用,2005,25(9):2192-2195. 被引量：6

同被引文献306

1宋少群,朱永利,于红.基于图论与人工智能搜索技术的电网拓扑跟踪方法[J].电网技术,2005,29(19):75-79. 被引量：48
2蒋艳凰,杨学军,易会战.卫星遥感图像并行几何校正算法研究[J].计算机学报,2004,27(7):944-951. 被引量：21
3吴鸿伟,汤伟宾,李晓潮,郭东辉.GPU编程原理及其在网络安全领域的应用算法分析[J].计算机科学,2012,39(S3):24-27. 被引量：2
4吴恩华,柳有权.基于图形处理器(GPU)的通用计算[J].计算机辅助设计与图形学学报,2004,16(5):601-612. 被引量：228
5唐明哲,邵志标,赵宁,许琪.32位浮点嵌入式MCU设计研究[J].微电子学与计算机,2004,21(7):30-33. 被引量：4
6任中方,张华,闫明松,陈世福.MVC模式研究的综述[J].计算机应用研究,2004,21(10):1-4. 被引量：197
7周宁宁,陈燕例,李爱群.基于FPGA技术的浮点运算器的设计与实现[J].计算机工程与设计,2005,26(6):1578-1581. 被引量：11
8李兴斯.一类不可微优化问题的有效解法[J].中国科学（A辑）,1994,24(4):371-377. 被引量：137
9江修波.ZigBee技术及其应用[J].低压电器,2005(7):27-29. 被引量：67
10徐国庆,杨丹.小波变换与FFT联合识别乐音[J].重庆大学学报（自然科学版）,2005,28(12):51-54. 被引量：5

引证文献29

1屈宜丽,蓝才会,任志国.CPU/GPU异构并行系统研究综述[J].自动化与仪器仪表,2016(4):25-26. 被引量：6
2李杰,陈庆奎.基于蓝牙4.0的GPU集群功耗测量系统设计[J].电子测量与仪器学报,2014,28(3):314-319. 被引量：8
3杨志文,程志平.嵌入式Quartz混合调度的多处理器平台任务分配设计[J].科技通报,2014,30(6):100-102. 被引量：2
4夏际金,丁泉,王蓉.多级并行的多核DSP软件设计[J].雷达科学与技术,2014,12(4):368-372. 被引量：5
5王海峰,陈庆奎.多指标自趋优的GPU集群能耗控制模型[J].计算机研究与发展,2015,52(1):105-115. 被引量：8
6余莹,李肯立,郑光勇.一种基于GPU集群的深度优先并行算法设计与实现[J].计算机科学,2015,42(1):82-85. 被引量：6
7刘光敏,陈庆奎,王海峰.海量数据流的提升小波变换并行算法研究[J].小型微型计算机系统,2015,36(2):343-348. 被引量：2
8巨涛,朱正东,董小社.异构众核系统及其编程模型与性能优化技术研究综述[J].电子学报,2015,43(1):111-119. 被引量：13
9谢晨伟,陆天翼,汤勇明.基于GPU通用计算平台的乐谱自动识别系统设计[J].电子器件,2015,38(4):908-911.
10邱夏珉.大数据CPU集群的实时功耗测量研究[J].信息与电脑,2015,27(9):46-47.

二级引证文献163

1吕朋朋,陶晓峰,毕善钰,缪平.基于BIM技术的弱电系统集成控制平台设计[J].自动化与仪器仪表,2020(4):129-132. 被引量：5
2陈鸿海,孙学良,赵鹤鸣,邵雷.高增益蓝牙天线的设计与应用[J].仪器仪表学报,2021,42(2):197-206. 被引量：12
3楼佳庆,卢洪煊,瞿涛,裘五四,田菊霞.壳与苍白球的空间位置关系[J].立体定向和功能性神经外科杂志,2000,13(1):12-14. 被引量：1
4鲍军鹏,杨科,周静.卫星时序数据挖掘节点级并行与优化方法[J].北京航空航天大学学报,2018,44(12):2470-2478. 被引量：7
5廖鹏飞,陈庆奎.基于蓝牙4.0与3G的无线传感器网关设计与实现[J].计算机工程,2015,41(9):13-18. 被引量：11
6汤媛媛,周海芳,方民权,申小龙.基于CPU/GPU异构模式的高光谱遥感影像数据处理研究与实现[J].计算机科学,2016,43(2):47-50. 被引量：7
7夏际金,崔留争.一种多核DSP的距离多普勒成像设计[J].雷达科学与技术,2016,14(2):169-172. 被引量：4
8夏际金,梁之勇,崔留争.多核并行的大点数FFT、IFFT设计[J].火控雷达技术,2016,45(1):64-68. 被引量：7
9李威钢,燕必希,董明利,王君,孙鹏.PTC摄影测量控制系统设计与实现[J].电子测量技术,2016,39(6):111-116. 被引量：2
10巨涛,张兴军,陈衡,董小社.面向众核系统的线程分组映射方法[J].西安交通大学学报,2016,50(10):57-63. 被引量：1

1蒋佩钊,邓冲,王阳萍.基于GPGPU的快速医学图像FCM分割算法[J].兰州交通大学学报,2014,33(3):87-92. 被引量：2
2田绪红,江敏杰.GPU加速的神经网络BP算法[J].计算机应用研究,2009,26(5):1679-1681. 被引量：6
3田昶.海量空间数据的分布式存储管理及并行处理技术分析[J].电子技术与软件工程,2015(11). 被引量：1
4虚拟现实技术研究进展与未来挑战[J].传感器世界,2002,8(12):35-35.
5张浩文.物联网大数据分析的初探[J].智能城市,2016,2(9):54-55. 被引量：3
6赵艳伟,于璐,张宁,刘凯,徐海旭.一种基于GPGPU的指控系统空间查询优化方法[J].指挥与控制学报,2015,1(4):395-402.
7张彤,刘钊,欧阳宁.基于GPU的图像快速傅立叶变换研究[J].微计算机信息,2009,25(15):286-287. 被引量：5
8田绪红,司徒志远,陈茂资,韩国强.基于GPU的3D距离变换[J].计算机应用研究,2008,25(9):2847-2849.
9罗金满.海量空间数据的分布式存储管理及并行处理技术分析[J].科技传播,2016,8(1):93-94. 被引量：1
10谈金泉.多TRANSPUTER系统的分布式存储管理[J].抗恶劣环境计算机,1993,7(5):42-47.

计算机学报

2013年第4期

浏览历史

内容加载中请稍等...

图形处理器通用计算关键技术研究综述被引量：29

参考文献86

二级参考文献155

共引文献406

同被引文献306

引证文献29

二级引证文献163

相关作者

相关机构

相关主题

浏览历史

图形处理器通用计算关键技术研究综述 被引量：29

参考文献86

二级参考文献155

共引文献406

同被引文献306

引证文献29

二级引证文献163

相关作者

相关机构

相关主题

浏览历史

图形处理器通用计算关键技术研究综述被引量：29