-
题名龙芯3A上三个自适应FFT包的对比与分析
- 1
-
-
作者
赵美超
张云泉
刘益群
李焱
颜深根
-
机构
中国科学院软件研究所并行软件与计算科学实验室
中国科学院软件研究所计算机科学国家重点实验室
中国科学院研究生院
-
出处
《计算机科学》
CSCD
北大核心
2012年第12期281-285,共5页
-
基金
国家自然科学基金(61133005)
国家高技术研究发展项目(863)(2009AA01A129
+1 种基金
2009AA01A134)
国家重大专项核高基项目(2009ZX01036-001-002)资助
-
文摘
FFT算法在计算机科学中具有广泛的应用,自适应FFT软件包以其良好的可移植性而备受研究人员和用户的青睐,龙芯3A是中科院计算所自主研发的四核CPU,采用RISC架构,兼容MIPS指令。主要对FFTW,UHFFT,SPIRAL这3类FFT自适应软件包进行研究。首先从搜索框架和代码产生器两方面总结了FFTW和UHFFT的异同,接着阐述了SPIRAL自动产生优化代码的三层架构实现原理,之后在国产CPU龙芯3A上对这3个软件包进行了性能测试,并结合龙芯的体系结构特点对结果作了分析对比。在最后总结了目前自适应FFT软件包的一般方法,为下一步开发自适应FFT软件包提供了思路。
-
关键词
FFTW
uhfft
SPIRAL
LOONGSON
3A
FFT
-
Keywords
FFTW
uhfft
SPIRAL
Loongson 3A
FFT
-
分类号
TP319
[自动化与计算机技术—计算机软件与理论]
-