期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于昇腾NPU的快速傅里叶变换算法设计与优化
1
作者 陆璐 王远飞 +1 位作者 梁志宏 索思亮 《华南理工大学学报(自然科学版)》 北大核心 2025年第11期9-17,共9页
快速傅里叶变换(Fast Fourier Transform,FFT)作为科学计算和信号处理领域的核心算法,已广泛应用于数字信号处理、图像处理、深度学习等领域。随着数据规模的增长和处理需求的提高,在新型硬件平台上优化FFT算法显得尤为重要。该文深入... 快速傅里叶变换(Fast Fourier Transform,FFT)作为科学计算和信号处理领域的核心算法,已广泛应用于数字信号处理、图像处理、深度学习等领域。随着数据规模的增长和处理需求的提高,在新型硬件平台上优化FFT算法显得尤为重要。该文深入分析了昇腾NPU的架构特点及其对FFT算法优化的影响,基于矩阵运算形式的Stockham FFT算法,提出了一系列创新性优化策略:设计了启发式radix选择算法,针对不同输入规模提供较优的radix序列组合;针对单次迭代FFT,开发了无需虚实分离的高效计算流程,显著减少了全局内存访问开销;提出了基于片上缓存的数据读取优化策略,大幅提升了数据访问速度;为多次迭代设计了数据布局优化方法,有效改善了整体访存效率。在搭载昇腾910 AI处理器的昇腾Atlas 800平台上的实验结果表明,该文提出的优化策略相比无优化基准实现了4.61的平均加速比;对各项优化策略进行的独立性能分析和验证表明,各单项优化策略的平均加速比为1.42~3.52。研究结果为在新型NPU架构上实现高效FFT算法提供了技术参考。 展开更多
关键词 快速傅里叶变换 昇腾npu 异构计算 高性能计算
在线阅读 下载PDF
基于昇腾平台的图像描述算法的部署与优化
2
作者 朱明航 冯杰 +3 位作者 马汉杰 邵蒙悦 刘新天 张海翔 《智能计算机与应用》 2024年第11期52-58,共7页
图像描述是一种通过文字来解释和呈现图像内容的技术,在计算机视觉、图像识别和人工智能等领域中具有重要的应用。针对华为昇腾平台,提出一个可部署的高性能图像描述模型。首先从高精确度的图像描述模型出发,通过算子可行性、精确度与... 图像描述是一种通过文字来解释和呈现图像内容的技术,在计算机视觉、图像识别和人工智能等领域中具有重要的应用。针对华为昇腾平台,提出一个可部署的高性能图像描述模型。首先从高精确度的图像描述模型出发,通过算子可行性、精确度与计算量两个方面进行综合分析,得到可部署且高效的方案,并对其进行一些算法上的优化,最终得到一个高性能的昇腾离线模型。在华为昇腾平台上,使用生成的模型对多张图像进行描述并分析描述结果,所生成的模型各个指标均有提升,其中CIDEr指标提升9%,每张图片推理时间为210.43 ms。 展开更多
关键词 昇腾 图像描述 强化学习 束算法 神经网络处理器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部