期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多核处理器BWDSP1042的FFT性能优化
被引量:
4
1
作者
蔺丽华
李敏
+2 位作者
苏涛
张美春
王佳仪
《电讯技术》
北大核心
2021年第6期759-764,共6页
博微DSP1042(BWDSP1042)是我国自主研发的一款高性能数字信号处理器。现阶段,由于BWDSP硬件计算资源和访存带宽限制,通过调优快速傅里叶变换(Fast Fourier Transform,FFT)算法结构运算时间仍可减少。基于高性能多核BWDSP1042体系架构以...
博微DSP1042(BWDSP1042)是我国自主研发的一款高性能数字信号处理器。现阶段,由于BWDSP硬件计算资源和访存带宽限制,通过调优快速傅里叶变换(Fast Fourier Transform,FFT)算法结构运算时间仍可减少。基于高性能多核BWDSP1042体系架构以及指令编排原则,优化了基-2FFT算法结构,在充分利用硬件资源的同时减少了FFT算法的运算时间。使用Matlab程序验证FFT汇编算法的正确性,并与BWDSP100、C6678函数库中的FFT算法的实际运行周期进行对比。研究结果表明,512点、1024点、2048点定点复数FFT算法的运算时间比BWDSP100函数库中的FFT和C6678函数库中的FFT均缩短了一倍多。
展开更多
关键词
数字信号处理
bwdsp1042
快速傅里叶变换
运算时间
在线阅读
下载PDF
职称材料
基于BWDSP1042的复数矩阵向量乘的优化与实现
2
作者
蔺丽华
张美春
+2 位作者
王佳仪
李敏
门浩
《计算机应用与软件》
北大核心
2023年第3期298-301,315,共5页
采用两种方法对复数矩阵向量乘进行优化,提高其在BWDSP1042上的运行效率。一是按列分块与减少二级循环内循环次数相结合的方法(矩阵列非4的倍数);二是模八寻址与减少二级循环内循环次数相结合的方法(矩阵列为4的倍数)。实验结果表明,采...
采用两种方法对复数矩阵向量乘进行优化,提高其在BWDSP1042上的运行效率。一是按列分块与减少二级循环内循环次数相结合的方法(矩阵列非4的倍数);二是模八寻址与减少二级循环内循环次数相结合的方法(矩阵列为4的倍数)。实验结果表明,采用第一种方法可缩短复数矩阵向量乘的运行周期2.8倍以上,第二种方法可缩短其运行周期3.1倍以上。
展开更多
关键词
bwdsp1042
复数矩阵向量乘
按列分块
模八寻址
运行效率
在线阅读
下载PDF
职称材料
题名
基于多核处理器BWDSP1042的FFT性能优化
被引量:
4
1
作者
蔺丽华
李敏
苏涛
张美春
王佳仪
机构
西安科技大学通信与信息工程学院
西安电子科技大学雷达信号处理国家重点实验室
出处
《电讯技术》
北大核心
2021年第6期759-764,共6页
基金
国家科技重大专项(2012ZX01034001-001)。
文摘
博微DSP1042(BWDSP1042)是我国自主研发的一款高性能数字信号处理器。现阶段,由于BWDSP硬件计算资源和访存带宽限制,通过调优快速傅里叶变换(Fast Fourier Transform,FFT)算法结构运算时间仍可减少。基于高性能多核BWDSP1042体系架构以及指令编排原则,优化了基-2FFT算法结构,在充分利用硬件资源的同时减少了FFT算法的运算时间。使用Matlab程序验证FFT汇编算法的正确性,并与BWDSP100、C6678函数库中的FFT算法的实际运行周期进行对比。研究结果表明,512点、1024点、2048点定点复数FFT算法的运算时间比BWDSP100函数库中的FFT和C6678函数库中的FFT均缩短了一倍多。
关键词
数字信号处理
bwdsp1042
快速傅里叶变换
运算时间
Keywords
digital signal processing
bwdsp1042
fast Fourier transform
calculation time
分类号
TN911.72 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于BWDSP1042的复数矩阵向量乘的优化与实现
2
作者
蔺丽华
张美春
王佳仪
李敏
门浩
机构
西安科技大学通信与信息工程学院
西安电子科技大学电子工程学院
出处
《计算机应用与软件》
北大核心
2023年第3期298-301,315,共5页
基金
国家“核心电子器件、高端通用芯片及基础软件产品”重大专项(2012ZX01034001-001)。
文摘
采用两种方法对复数矩阵向量乘进行优化,提高其在BWDSP1042上的运行效率。一是按列分块与减少二级循环内循环次数相结合的方法(矩阵列非4的倍数);二是模八寻址与减少二级循环内循环次数相结合的方法(矩阵列为4的倍数)。实验结果表明,采用第一种方法可缩短复数矩阵向量乘的运行周期2.8倍以上,第二种方法可缩短其运行周期3.1倍以上。
关键词
bwdsp1042
复数矩阵向量乘
按列分块
模八寻址
运行效率
Keywords
bwdsp1042
Complex matrix vector multiplication
Block by column
Modulo-8 addressing
Operation efficiency
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多核处理器BWDSP1042的FFT性能优化
蔺丽华
李敏
苏涛
张美春
王佳仪
《电讯技术》
北大核心
2021
4
在线阅读
下载PDF
职称材料
2
基于BWDSP1042的复数矩阵向量乘的优化与实现
蔺丽华
张美春
王佳仪
李敏
门浩
《计算机应用与软件》
北大核心
2023
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部