-
题名基于昇腾NPU的快速傅里叶变换算法设计与优化
- 1
-
-
作者
陆璐
王远飞
梁志宏
索思亮
-
机构
华南理工大学计算机科学与工程学院
南方电网科学研究院有限责任公司
广东省电力系统网络安全企业重点实验室
-
出处
《华南理工大学学报(自然科学版)》
北大核心
2025年第11期9-17,共9页
-
基金
广东省自然科学基金项目(2024A1515010204)
南方电网科学研究院有限责任公司项目(1500002024030103XA00063)。
-
文摘
快速傅里叶变换(Fast Fourier Transform,FFT)作为科学计算和信号处理领域的核心算法,已广泛应用于数字信号处理、图像处理、深度学习等领域。随着数据规模的增长和处理需求的提高,在新型硬件平台上优化FFT算法显得尤为重要。该文深入分析了昇腾NPU的架构特点及其对FFT算法优化的影响,基于矩阵运算形式的Stockham FFT算法,提出了一系列创新性优化策略:设计了启发式radix选择算法,针对不同输入规模提供较优的radix序列组合;针对单次迭代FFT,开发了无需虚实分离的高效计算流程,显著减少了全局内存访问开销;提出了基于片上缓存的数据读取优化策略,大幅提升了数据访问速度;为多次迭代设计了数据布局优化方法,有效改善了整体访存效率。在搭载昇腾910 AI处理器的昇腾Atlas 800平台上的实验结果表明,该文提出的优化策略相比无优化基准实现了4.61的平均加速比;对各项优化策略进行的独立性能分析和验证表明,各单项优化策略的平均加速比为1.42~3.52。研究结果为在新型NPU架构上实现高效FFT算法提供了技术参考。
-
关键词
快速傅里叶变换
昇腾npu
异构计算
高性能计算
-
Keywords
fast Fourier transform
ascend npu
heterogeneous computing
high-performance computing
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名基于昇腾平台的图像描述算法的部署与优化
- 2
-
-
作者
朱明航
冯杰
马汉杰
邵蒙悦
刘新天
张海翔
-
机构
浙江理工大学计算机科学与技术学院(人工智能学院)
浙江理工大学信息科学与工程学院
-
出处
《智能计算机与应用》
2024年第11期52-58,共7页
-
基金
浙江省科技计划项目(2021C01163)。
-
文摘
图像描述是一种通过文字来解释和呈现图像内容的技术,在计算机视觉、图像识别和人工智能等领域中具有重要的应用。针对华为昇腾平台,提出一个可部署的高性能图像描述模型。首先从高精确度的图像描述模型出发,通过算子可行性、精确度与计算量两个方面进行综合分析,得到可部署且高效的方案,并对其进行一些算法上的优化,最终得到一个高性能的昇腾离线模型。在华为昇腾平台上,使用生成的模型对多张图像进行描述并分析描述结果,所生成的模型各个指标均有提升,其中CIDEr指标提升9%,每张图片推理时间为210.43 ms。
-
关键词
昇腾
图像描述
强化学习
束算法
神经网络处理器
-
Keywords
ascend
image captioning
reinforcement learning
beam search
npu
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-