期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于多核处理器BWDSP1042的FFT性能优化 被引量:4
1
作者 蔺丽华 李敏 +2 位作者 苏涛 张美春 王佳仪 《电讯技术》 北大核心 2021年第6期759-764,共6页
博微DSP1042(BWDSP1042)是我国自主研发的一款高性能数字信号处理器。现阶段,由于BWDSP硬件计算资源和访存带宽限制,通过调优快速傅里叶变换(Fast Fourier Transform,FFT)算法结构运算时间仍可减少。基于高性能多核BWDSP1042体系架构以... 博微DSP1042(BWDSP1042)是我国自主研发的一款高性能数字信号处理器。现阶段,由于BWDSP硬件计算资源和访存带宽限制,通过调优快速傅里叶变换(Fast Fourier Transform,FFT)算法结构运算时间仍可减少。基于高性能多核BWDSP1042体系架构以及指令编排原则,优化了基-2FFT算法结构,在充分利用硬件资源的同时减少了FFT算法的运算时间。使用Matlab程序验证FFT汇编算法的正确性,并与BWDSP100、C6678函数库中的FFT算法的实际运行周期进行对比。研究结果表明,512点、1024点、2048点定点复数FFT算法的运算时间比BWDSP100函数库中的FFT和C6678函数库中的FFT均缩短了一倍多。 展开更多
关键词 数字信号处理 bwdsp1042 快速傅里叶变换 运算时间
在线阅读 下载PDF
基于BWDSP1042的复数矩阵向量乘的优化与实现
2
作者 蔺丽华 张美春 +2 位作者 王佳仪 李敏 门浩 《计算机应用与软件》 北大核心 2023年第3期298-301,315,共5页
采用两种方法对复数矩阵向量乘进行优化,提高其在BWDSP1042上的运行效率。一是按列分块与减少二级循环内循环次数相结合的方法(矩阵列非4的倍数);二是模八寻址与减少二级循环内循环次数相结合的方法(矩阵列为4的倍数)。实验结果表明,采... 采用两种方法对复数矩阵向量乘进行优化,提高其在BWDSP1042上的运行效率。一是按列分块与减少二级循环内循环次数相结合的方法(矩阵列非4的倍数);二是模八寻址与减少二级循环内循环次数相结合的方法(矩阵列为4的倍数)。实验结果表明,采用第一种方法可缩短复数矩阵向量乘的运行周期2.8倍以上,第二种方法可缩短其运行周期3.1倍以上。 展开更多
关键词 bwdsp1042 复数矩阵向量乘 按列分块 模八寻址 运行效率
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部