期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于ZCU102 DSP的CNN卷积运算加速方法 被引量:3
1
作者 苗鑫 周欢欢 陆栋洵 《自动化技术与应用》 2022年第12期64-67,共4页
本文提出设计了一种在ZCU102平台上加速卷积神经网络(CNN)卷积运算的方法,使用1个DSP IP实现卷积操作中1个int8类型或者unit8类型输入特征图像数据和2个int8类型卷积核参数的乘法运算。卷积运算是卷积神经网络的基本操作,提高卷积运算... 本文提出设计了一种在ZCU102平台上加速卷积神经网络(CNN)卷积运算的方法,使用1个DSP IP实现卷积操作中1个int8类型或者unit8类型输入特征图像数据和2个int8类型卷积核参数的乘法运算。卷积运算是卷积神经网络的基本操作,提高卷积运算并行度可使卷积运算速率提升一倍。8-bit卷积神经网络量化技术是设计实现的基础,减少了处理器(PS)数据传输带宽需求。ZCU102 MPSoC的可编程逻辑(PL)资源较少,充分利用DSP IP资源可降低逻辑资源需求,提升逻辑资源利用率,增加SoC系统设计灵活性。 展开更多
关键词 zcu102 DSP IP 人工智能 卷积神经网络 8-bit量化
在线阅读 下载PDF
面向嵌入式平台的光学遥感飞机目标快速检测算法 被引量:2
2
作者 秦煜 陆陈鑫 +3 位作者 刘艳丽 吴庆学 张琦 张小贝 《遥感学报》 北大核心 2025年第3期762-775,共14页
针对目前深度学习检测算法在遥感图像在轨实时处理任务上综合性能不平衡和在星载嵌入式设备上难以部署的问题,基于YOLOX-s算法,提出一种面向嵌入式平台的光学遥感飞机目标快速检测算法LAD-YOLOX(Lightweight Aircraft Detection YOLOX)... 针对目前深度学习检测算法在遥感图像在轨实时处理任务上综合性能不平衡和在星载嵌入式设备上难以部署的问题,基于YOLOX-s算法,提出一种面向嵌入式平台的光学遥感飞机目标快速检测算法LAD-YOLOX(Lightweight Aircraft Detection YOLOX)。首先,在硬件感知网络的设计上,基于ShuffleNetv2设计超轻量、高精度的骨干模块ES-Block (Enhanced ShuffleNet Block),重构原有的主干特征提取网络;其次,引入GSConv构建轻量级颈部特征融合网络GS-Neck,使得前后端结构的参数量配比均衡,降低计算复杂度的同时精度损失更小;然后,设计轻量级解耦合检测头网络结构,进一步提升飞机目标分类和定位的特征编码,降低模型参数量,提升检测性能;最后,为LAD-YOLOX算法替换置信度预测损失函数Varifocal Loss及边界框定位损失函数SIoU Loss,提高模型训练的收敛速度和推理时的精度。基于公开的RSOD遥感数据集和自制飞机数据集,对比其他SOTA模型,对本文提出的LAD-YOLOX算法进行仿真试验验证。结果表明:LAD-YOLOX算法在RSOD遥感数据集上,计算量压缩为原始YOLOX-s模型的43.72%,检测精度损失0.2%,检测速度提高24 FPS;本文提出计算方法在XILINX EK-U1-ZCU102-G评估套件上完成算法部署及加速,对自制飞机数据集的检测速度至少可达到26.53 FPS,能够满足在轨实时、准确检测飞机目标的需求。 展开更多
关键词 遥感 在轨目标检测 轻量化 YOLOX RSOD数据集 zcu102
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部