期刊文献+

一种Cholesky分解重叠算法

A Cholesky Decomposition Overlapped Algorithm
在线阅读 下载PDF
导出
摘要 在图形处理单元(GPU)平台的计算中,GPU设备存储器和内存容量相差较大,待处理数据通常无法一次性从内存拷贝至显存中进行运算。为此,提出一种Cholesky分解重叠算法。采用预存取技术,拷贝数据和计算重叠,降低设备的等待时间,将设备存储器划分为2个缓冲区,轮流存放本次运算数据和下次待运算数据,在设备运算过程中完成设备存储器和内存之间的数据交换。实验结果表明,该算法可以有效提高运算效率。 In the computation of Graphics Processing Unit(GPU) platform,GPU equipment storage and memory capacity is different.Processed data usually cannot finish operation from memory copy to the video memory in one-time.In order to solve this problem,this paper proposes a Cholesky decomposition overlapped algorithm.By dividing the device storage into two buffers,current data and next data for calculation are stored in turn,data swap between device storage and memory takes place in the process of computation.Experimental results show that the algorithm can increase the system efficiency.
出处 《计算机工程》 CAS CSCD 2012年第18期262-264,共3页 Computer Engineering
关键词 图形处理单元 预存取 重叠算法 通用计算 CHOLESKY分解 集群系统 Graphics Processing Unit(GPU); prefetching; overlapped algorithm; general purpose computation; Cholesky decomposition; cluster system
  • 相关文献

参考文献7

二级参考文献91

  • 1吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504. 被引量:141
  • 2迟学斌.Transputer上Cholesky分解的并行实现[J].计算数学,1993,15(3):289-294. 被引量:4
  • 3杨兵,李凤霞,战守义,胡敏勇.GPU在复杂场景的阴影绘制中的应用[J].计算机工程,2006,32(2):220-222. 被引量:9
  • 4周树荃 邓绍忠 等.变带宽大型稀疏线性方程组的并行直接解法及其在YH-1的实现.航空科学基金论文集[M].北京:航空工业出版社,1993.216-220.
  • 5CUDA Programming Guide 1.1 [Z]. (2007-09-11). http://developer. nvidia.com/object/cuda.html.
  • 6龚敏敏.GPU精粹2[M].北京:清华大学出版社,2007.
  • 7Intel Math Kernel Library for the Windows* Operating System Users' Guide[Z]. (2007-09-11). http://www.intel.com.
  • 8Dongarra J, Foster I, Fox G, et al. Sourcebook of Parallel Computing[M]. [S. l.]: Elsevier Science, 2003.
  • 9Anderson E,Bai Z,Bischof C,et al.LAPACK Users' Guide[M].3rd ed.Philadelphia,PA:SIAM,1999.
  • 10Blackford L S,Choi J,Cleary A,et al.ScaLAPACK Users' Guide[M] ,Philadelphia,PA:SIAM,1997.

共引文献270

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部