期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
FFT算法的并行化性能分析
被引量:
1
1
作者
王璐
梁涛
王文义
《中原工学院学报》
CAS
2010年第5期30-32,41,共4页
以串行FFTW为基准,从程序运行时间、通信开销两方面分析了基于消息传递型(MPI-FFT)和共享内存型(CUFFT)并行FFT实现的性能.实验表明,并行FFT都可以提升计算速度至FFTW的30~80倍,对于中等规模的数据,CUFFT的计算速度略优于MPI-FFT,且其...
以串行FFTW为基准,从程序运行时间、通信开销两方面分析了基于消息传递型(MPI-FFT)和共享内存型(CUFFT)并行FFT实现的性能.实验表明,并行FFT都可以提升计算速度至FFTW的30~80倍,对于中等规模的数据,CUFFT的计算速度略优于MPI-FFT,且其通信开销明显较低,具有较高性价比和较好的应用前景.
展开更多
关键词
并行性能
cufft
MPI
FFTW
在线阅读
下载PDF
职称材料
基于零拷贝的脉冲星GPU相干消色散算法
被引量:
2
2
作者
王博群
张海龙
+5 位作者
王杰
冶鑫晨
王万琼
李嘉
张萌
张亚州
《天文研究与技术》
CSCD
2021年第3期372-379,共8页
射电脉冲信号在传输过程中受到星际介质的影响,脉冲轮廓展宽变形,在研究过程中需要对信号进行消色散处理。设计并实现了基于零拷贝的脉冲星数据图形处理器(Graphic Processing Unit,GPU)相干消色散算法,采用设备内存映射以消除主机到设...
射电脉冲信号在传输过程中受到星际介质的影响,脉冲轮廓展宽变形,在研究过程中需要对信号进行消色散处理。设计并实现了基于零拷贝的脉冲星数据图形处理器(Graphic Processing Unit,GPU)相干消色散算法,采用设备内存映射以消除主机到设备的拷贝开销,利用统一计算设备架构(Compute Unified Device Architecture,CUDA)的cuFFT库进行多批次傅里叶变换以提高离散傅里叶变换(Discrete Fourier Transform,DFT)的效率,同时采用多线程实现了传递函数的加速计算。实验结果表明,与传统中央处理器及图形处理器算法相比,本文的算法在数据量大时表现良好。
展开更多
关键词
零拷贝
相干消色散
图形处理器
统一计算设备架构
cufft
在线阅读
下载PDF
职称材料
题名
FFT算法的并行化性能分析
被引量:
1
1
作者
王璐
梁涛
王文义
机构
中原工学院
出处
《中原工学院学报》
CAS
2010年第5期30-32,41,共4页
基金
河南省教育厅自然科学研究项目(2009A520034)
文摘
以串行FFTW为基准,从程序运行时间、通信开销两方面分析了基于消息传递型(MPI-FFT)和共享内存型(CUFFT)并行FFT实现的性能.实验表明,并行FFT都可以提升计算速度至FFTW的30~80倍,对于中等规模的数据,CUFFT的计算速度略优于MPI-FFT,且其通信开销明显较低,具有较高性价比和较好的应用前景.
关键词
并行性能
cufft
MPI
FFTW
Keywords
parallel performance analysis
cufft
MPI
FFTW
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于零拷贝的脉冲星GPU相干消色散算法
被引量:
2
2
作者
王博群
张海龙
王杰
冶鑫晨
王万琼
李嘉
张萌
张亚州
机构
中国科学院新疆天文台
中国科学院大学
中国科学院射电天文重点实验室
国家天文科学数据中心
出处
《天文研究与技术》
CSCD
2021年第3期372-379,共8页
基金
国家自然科学基金(11873082,11803080)
国家重点研发计划(2018YFA0404704)
+2 种基金
中国科学院青年创新促进会
国家天文科学数据中心
中国科学院科学数据中心体系资助.
文摘
射电脉冲信号在传输过程中受到星际介质的影响,脉冲轮廓展宽变形,在研究过程中需要对信号进行消色散处理。设计并实现了基于零拷贝的脉冲星数据图形处理器(Graphic Processing Unit,GPU)相干消色散算法,采用设备内存映射以消除主机到设备的拷贝开销,利用统一计算设备架构(Compute Unified Device Architecture,CUDA)的cuFFT库进行多批次傅里叶变换以提高离散傅里叶变换(Discrete Fourier Transform,DFT)的效率,同时采用多线程实现了传递函数的加速计算。实验结果表明,与传统中央处理器及图形处理器算法相比,本文的算法在数据量大时表现良好。
关键词
零拷贝
相干消色散
图形处理器
统一计算设备架构
cufft
Keywords
zero-copy
coherent de-dispersion
GPU
CUDA
cufft
分类号
P161.4 [天文地球—天文学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
FFT算法的并行化性能分析
王璐
梁涛
王文义
《中原工学院学报》
CAS
2010
1
在线阅读
下载PDF
职称材料
2
基于零拷贝的脉冲星GPU相干消色散算法
王博群
张海龙
王杰
冶鑫晨
王万琼
李嘉
张萌
张亚州
《天文研究与技术》
CSCD
2021
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部