期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于Vitis AI的可行驶区域检测定制计算系统设计 被引量:1
1
作者 李慧琳 柴志雷 《现代信息科技》 2022年第1期73-78,共6页
针对基于卷积神经网络的可行驶区域检测方法计算耗时长、实时性差等问题,基于Vitis AI为其设计了一种定制计算系统,并通过采用模型定点化、网络剪枝、硬件定制等优化方法,实现了对可行驶区域检测方法的高效计算。实验结果表明,在Xilinx ... 针对基于卷积神经网络的可行驶区域检测方法计算耗时长、实时性差等问题,基于Vitis AI为其设计了一种定制计算系统,并通过采用模型定点化、网络剪枝、硬件定制等优化方法,实现了对可行驶区域检测方法的高效计算。实验结果表明,在Xilinx ZCU102异构计算平台上,可编程逻辑部分的工作频率为200 MHz时,所实现的可行使区域检测系统的识别帧率可达到46 FPS,计算性能可达903 GOPS,能效比为50.45 GOPS/W,可以较好地满足实际系统的需求。 展开更多
关键词 现场可编程门阵列 vitis ai 可行驶区域检测 定制计算系统 卷积神经网络
在线阅读 下载PDF
基于Vitis AI的语义分割网络加速器研究与实现
2
作者 李慧琳 柴志雷 《单片机与嵌入式系统应用》 2022年第7期17-20,25,共5页
本文基于Xilinx Vitis AI对语义分割网络U Net进行网络定点化、深度学习处理单元DPU定制、软硬件协同优化等加速方法,最终在Xilinx ZCU102异构平台上实现了语义分割加速器的设计,在较低的精度损失下降低硬件资源消耗,完成了整个U Net网... 本文基于Xilinx Vitis AI对语义分割网络U Net进行网络定点化、深度学习处理单元DPU定制、软硬件协同优化等加速方法,最终在Xilinx ZCU102异构平台上实现了语义分割加速器的设计,在较低的精度损失下降低硬件资源消耗,完成了整个U Net网络的软硬件系统开发。实验结果表明,整个U Net网络硬件加速器的处理帧率可达42 fps,证明了该神经网络加速方案的有效性。 展开更多
关键词 现场可编程门阵列 深度学习处理单元 语义分割 vitis ai 卷积神经网络
在线阅读 下载PDF
基于Vitis AI神经网络模型部署的实验教学研究与设计
3
作者 郑红党 余龙斌 +2 位作者 沈涛 盛佳兴 刘辉 《实验技术与管理》 2026年第1期211-218,共8页
将神经网络部署到FPGA上可以显著提高推理速度和效率,因此该实验设计对于深度学习和FPGA课程教学都具有重要意义。实验设计中剖析了神经网络模型运行于全可编程架构FPGA的结构和原理,详细分析了运用Vitis AI工具部署神经网络模型的方法... 将神经网络部署到FPGA上可以显著提高推理速度和效率,因此该实验设计对于深度学习和FPGA课程教学都具有重要意义。实验设计中剖析了神经网络模型运行于全可编程架构FPGA的结构和原理,详细分析了运用Vitis AI工具部署神经网络模型的方法。基于Vitis AI的部署过程的主要环节包括:在FPGA上架构软硬件平台,DPU的定制化设计与链接,神经网络模型的优化、剪枝和量化、编译。以城市场景语义分割模型为例,在Zynq APSoC ZU4EV平台上展示了神经网络模型部署的全过程,并对部署后的运行性能进行了比较分析。结果表明,FPGA平台上的运行精度MIo U会有2%左右的损失,但帧率及功耗均明显优于CPU;运行帧率不如GPU,但功耗远低于GPU,能效为GPU平台的4.3倍。 展开更多
关键词 FPGA vitis ai 神经网络模型 DPU 语义分割
在线阅读 下载PDF
基于ZYNQ的交通标志识别系统设计与实现 被引量:1
4
作者 陈宇杰 朱泽齐 +1 位作者 查宇恒 孙科学 《计算机技术与发展》 2025年第11期161-170,共10页
针对现有主流交通标志识别算法在复杂场景下易存在漏检、误检现象以及计算效率不高、识别速度较慢的问题,提出了包含预处理、交通标志检测与交通标志识别的轻量化算法,并设计实现了一种基于ZYNQ的交通标志识别系统。首先,设计了一种改... 针对现有主流交通标志识别算法在复杂场景下易存在漏检、误检现象以及计算效率不高、识别速度较慢的问题,提出了包含预处理、交通标志检测与交通标志识别的轻量化算法,并设计实现了一种基于ZYNQ的交通标志识别系统。首先,设计了一种改进的多尺度Retinex算法以减轻光照条件对后续检测识别算法的影响,并提出了一种基于颜色-形状的检测方法;其次,在轻量级深度学习网络MobileNet V3的基础上引入超轻量级ECA注意力模块代替原本的SE注意力模块,进一步降低网络的参数量与复杂度;最后,设计与封装图像处理算法的RTL级电路,利用Vitis AI工具完成神经网络的量化与编译,在ZYNQ平台搭建交通标志识别系统。实验结果表明:该系统算法在测试集中的mAP达到了0.96,网络参数量降低为原来的58.6%。最终整体系统的识别准确率达到了89.1%,单张图像的推理速度仅有39.9 ms,满足了交通标志识别实际应用中对可靠性与实时性的需求。 展开更多
关键词 交通标志识别 ZYNQ Retinex增强 联合色彩空间分割 MobileNet V3 vitis ai
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部