期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
FFT算法的并行化性能分析 被引量:1
1
作者 王璐 梁涛 王文义 《中原工学院学报》 CAS 2010年第5期30-32,41,共4页
以串行FFTW为基准,从程序运行时间、通信开销两方面分析了基于消息传递型(MPI-FFT)和共享内存型(CUFFT)并行FFT实现的性能.实验表明,并行FFT都可以提升计算速度至FFTW的30~80倍,对于中等规模的数据,CUFFT的计算速度略优于MPI-FFT,且其... 以串行FFTW为基准,从程序运行时间、通信开销两方面分析了基于消息传递型(MPI-FFT)和共享内存型(CUFFT)并行FFT实现的性能.实验表明,并行FFT都可以提升计算速度至FFTW的30~80倍,对于中等规模的数据,CUFFT的计算速度略优于MPI-FFT,且其通信开销明显较低,具有较高性价比和较好的应用前景. 展开更多
关键词 并行性能 cufft MPI FFTW
在线阅读 下载PDF
基于零拷贝的脉冲星GPU相干消色散算法 被引量:2
2
作者 王博群 张海龙 +5 位作者 王杰 冶鑫晨 王万琼 李嘉 张萌 张亚州 《天文研究与技术》 CSCD 2021年第3期372-379,共8页
射电脉冲信号在传输过程中受到星际介质的影响,脉冲轮廓展宽变形,在研究过程中需要对信号进行消色散处理。设计并实现了基于零拷贝的脉冲星数据图形处理器(Graphic Processing Unit,GPU)相干消色散算法,采用设备内存映射以消除主机到设... 射电脉冲信号在传输过程中受到星际介质的影响,脉冲轮廓展宽变形,在研究过程中需要对信号进行消色散处理。设计并实现了基于零拷贝的脉冲星数据图形处理器(Graphic Processing Unit,GPU)相干消色散算法,采用设备内存映射以消除主机到设备的拷贝开销,利用统一计算设备架构(Compute Unified Device Architecture,CUDA)的cuFFT库进行多批次傅里叶变换以提高离散傅里叶变换(Discrete Fourier Transform,DFT)的效率,同时采用多线程实现了传递函数的加速计算。实验结果表明,与传统中央处理器及图形处理器算法相比,本文的算法在数据量大时表现良好。 展开更多
关键词 零拷贝 相干消色散 图形处理器 统一计算设备架构 cufft
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部