期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
YOLOv5-Tiny-INT8与红外传感器的边缘端多模态轻量化融合
1
作者 立梓辰 《信息化研究》 2025年第5期174-177,共4页
针对边缘设备在复杂环境,如低光照、大雾等目标检测下精度不足且资源受限的问题,本文提出YOLOv5-Tiny-INT8与红外传感器的多模态轻量化融合方案。通过设计双模态特征提取子网络实现可见光与红外数据的适配与初步特征提取,结合跨尺度注... 针对边缘设备在复杂环境,如低光照、大雾等目标检测下精度不足且资源受限的问题,本文提出YOLOv5-Tiny-INT8与红外传感器的多模态轻量化融合方案。通过设计双模态特征提取子网络实现可见光与红外数据的适配与初步特征提取,结合跨尺度注意力融合机制动态分配模态权重,再经量化压缩优化降低资源消耗。实验表明,该方案在边缘设备上,复杂场景检测准确率提升19.3%~27.6%,模型大小缩减21%,帧率维持20fps以上,验证了其在资源有限场景下的有效性。 展开更多
关键词 YOLOv5-Tiny-int8 红外传感器 边缘端 多模态 轻量化融合
在线阅读 下载PDF
TDC转置卷积硬件加速器的设计与优化
2
作者 王国庆 严利民 《西安电子科技大学学报》 北大核心 2025年第2期156-166,共11页
转置卷积在深度学习(Deep Learning, DL)任务中应用广泛,但是在小型快速超分辨率卷积神经网络(Fast Super-Resolution Convolutional Neural Network-small, FSRCNN-s)中已经成为推理阶段的主要性能瓶颈,因此设计高效的转置卷积硬件加... 转置卷积在深度学习(Deep Learning, DL)任务中应用广泛,但是在小型快速超分辨率卷积神经网络(Fast Super-Resolution Convolutional Neural Network-small, FSRCNN-s)中已经成为推理阶段的主要性能瓶颈,因此设计高效的转置卷积硬件加速器至关重要。基于转换转置卷积为卷积(Transforming Deconvolution to Convolution, TDC)算法,将步长为2的转置卷积软件推理流程转换为4路并行的直接卷积硬件实现,验证了不完美映射情况下算法和硬件加速器的正确性。完成转置卷积加速器设计后,选择FSRCNN-s×2网络进行端到端部署,采用软硬件协同设计和8位整数(Integer 8-bit, INT8)量化调度策略平衡转置卷积推理精度和速度之间的矛盾。实验结果表明,设计的转置卷积硬件加速器精度损失在0.5dB以内,相比CPU基线推理速度缩短到17ms。对比其他转置卷积加速器,设计的整数推理加速器显著降低了数字信号处理器(Digital Signal Processor, DSP)资源占用,将DSP效率提高为0.200每秒十亿次运算(Giga Operations Per Second, GOPS)/DSP,为低位宽整数推理转置卷积加速器设计提供参考。 展开更多
关键词 卷积神经网络 转置卷积 转换转置卷积为卷积算法 int8量化 硬件加速器
在线阅读 下载PDF
基于Jetson Nano的头盔佩戴检测系统设计
3
作者 彭梓洋 周顺勇 +3 位作者 陆欢 张鑫 张航领 罗扬铭 《四川轻化工大学学报(自然科学版)》 2025年第1期69-76,共8页
当前,许多用于检测头盔佩戴情况的算法在低算力嵌入式设备上无法满足实时检测的需求,从而限制了头盔佩戴检测技术的广泛应用。针对这一难题,本文提出了一种针对Jetson Nano开发板的TensorRT优化部署方法。首先,采用Int8量化、层间融合... 当前,许多用于检测头盔佩戴情况的算法在低算力嵌入式设备上无法满足实时检测的需求,从而限制了头盔佩戴检测技术的广泛应用。针对这一难题,本文提出了一种针对Jetson Nano开发板的TensorRT优化部署方法。首先,采用Int8量化、层间融合和张量融合等技术提升算法性能和加速推理速度;然后,利用TensorRT的自动化校准过程,使算法性能损失最小,解决使用Int8导致信息丢失的问题。实验表明,将头盔佩戴检测算法模型部署到Jetson Nano嵌入式设备中后,mAP@0.5达到98.63%,推理总耗时从320.52 ms减少到64.11 ms,减少了80%。这一改进有效地解决了算法在低算力嵌入式设备下部署推理的实时性不足的问题,为头盔佩戴检测技术的推广应用提供了新思路。 展开更多
关键词 嵌入式开发 TensorRT int8量化 层间融合 张量融合
在线阅读 下载PDF
融合GhostNet的YOLOv4轻量化网络设计与实现 被引量:3
4
作者 石博雅 董学峰 《小型微型计算机系统》 CSCD 北大核心 2024年第3期651-656,共6页
由于存储资源和功耗等限制,在嵌入式设备上部署基于深度学习的目标检测算法存在困难,且效果不佳.基于YOLOv4算法,提出了一种改进的YOLOv4-Light轻量化网络模型,采用GhostNet网络结构替换CSPDarknet53作为主干提取网络,引入CBAM注意力机... 由于存储资源和功耗等限制,在嵌入式设备上部署基于深度学习的目标检测算法存在困难,且效果不佳.基于YOLOv4算法,提出了一种改进的YOLOv4-Light轻量化网络模型,采用GhostNet网络结构替换CSPDarknet53作为主干提取网络,引入CBAM注意力机制关注通道和空间两个维度的特征信息,并利用感知量化方法对权重进行INT8量化处理,在保证精度的情况下降低网络模型规模和参数量.在PC端和NVIDIA Jetson Xavier NX上选用VisDrone无人机数据集分别对网络模型进行测试,结果表明YOLOv4-GhostNet-CBAM模型的尺寸是160M,比YOLOv4降低了34.43%;检测速率最高可达到34.6FPS,比YOLOv4提高了56.6%.YOLO-Light模型的尺寸是40.2M,比YOLOv4降低了83.5%;检测速率最高可达到78.6FPS,为YOLOv4的3.6倍,且交并比为0.5时的平均精度均值(mAP50)与YOLOv4相比仅下降了3%.YOLO-Light模型相较于原模型优势明显,能够在低功耗的嵌入式设备上完成实时目标检测. 展开更多
关键词 目标检测 YOLOv4 轻量化网络 嵌入式设备 int8量化
在线阅读 下载PDF
Real-Time Ranging of Vehicles and Pedestrians for Mobile Application on Smartphones
5
作者 ZHOU Su ZHONG Zebin 《Journal of Shanghai Jiaotong university(Science)》 2024年第6期1081-1090,共10页
The vehicles and pedestrians ranging is one of the basic functions of advanced driving assistance system.However,most of the ranging systems can only work on workstations with high computing power.To solve this proble... The vehicles and pedestrians ranging is one of the basic functions of advanced driving assistance system.However,most of the ranging systems can only work on workstations with high computing power.To solve this problem,a lightweight algorithm is proposed to be packaged into Android application package,and be installed in Android smartphones for vehicles and pedestrians ranging.The proposed ranging system is based on the images obtained by smartphone’s monocular camera.To achieve real-time ranging,an 8-bit integer(int8)quantization algorithm is proposed to accelerate the inference of convolutional neural networks.To increase the detection precision,a zoom-in algorithm is further proposed to detect small targets in the distance.After having detected the 2D bounding boxes of vehicles and pedestrians,a pinhole ranging method is applied to estimate the distance.In order to verify the proposed algorithm,the mean average precision(mAP)and the frame per second(FPS)are first tested by using COCO dataset on Huawei P40Pro,then,the ranging precision on the real road.The experimental results show that this algorithm can successfully perform real-time ranging(15 FPS)with high precision(34.8 mAP)onto the tested smartphones.Finally,a possible mobile application based on the ranging algorithm,i.e.,distance keeping warning,is also provided. 展开更多
关键词 advanced driving assistance system computer vision int8 quantization visual ranging smartphone application
原文传递
基于YOLOv5的无人车自主目标识别优化算法 被引量:3
6
作者 赵晓冬 张洵颖 《兵工学报》 EI CAS CSCD 北大核心 2023年第9期2732-2744,共13页
复杂地面战场环境下的自主目标识别是未来无人车实现智能化作战的关键技术。如何将基于深度学习的自主目标识别算法进行资源受限情况下的嵌入式计算平台部署应用,已成为目前无人车智能化赋能亟待解决的核心问题。以用于地面自主目标识别... 复杂地面战场环境下的自主目标识别是未来无人车实现智能化作战的关键技术。如何将基于深度学习的自主目标识别算法进行资源受限情况下的嵌入式计算平台部署应用,已成为目前无人车智能化赋能亟待解决的核心问题。以用于地面自主目标识别的YOLOv5深度神经网络结构为基础,提出一种基于改进型注意力模块和BatchNorm层的多正则项自适应网络裁剪算法,在裁剪与训练的协同过程中实现网络结构的最优化裁剪;设计一种对权重实施不饱和映射以及对激活值实施饱和映射的组合式训练后INT8量化算法。将压缩优化后的YOLOv5x网络在基于Zynq UltraScale+MPSoC架构的嵌入式计算平台上进行应用部署及验证。验证结果表明:YOLOv5x网络在通道裁剪40%和INT8量化时,红外目标识别精度仅减少0.374%,可见光目标识别精度提升0.065%,目标识别帧频均可达到25帧/s,能够满足无人车复杂战场环境下自主目标识别的准确度及实时性要求;自主目标识别神经网络压缩优化算法可扩展应用于无人机、精确制导武器等其他作战平台。 展开更多
关键词 无人车 目标识别 YOLOv5x 正则化裁剪 int8量化算法 嵌入式平台
在线阅读 下载PDF
无人车地面目标识别及其优化技术研究 被引量:2
7
作者 张洵颖 赵晓冬 +1 位作者 裴茹霞 张丽娜 《无人系统技术》 2020年第6期59-67,共9页
针对智能目标识别算法在无人车嵌入式硬件上的应用需求,研究基于卷积神经网络的地面目标识别算法及其硬件适应性优化技术,提出了基于双正则项的自适应网络裁剪优化算法及面向FPGA的神经网络INT8量化优化算法。针对裁剪及量化后的YOLO V... 针对智能目标识别算法在无人车嵌入式硬件上的应用需求,研究基于卷积神经网络的地面目标识别算法及其硬件适应性优化技术,提出了基于双正则项的自适应网络裁剪优化算法及面向FPGA的神经网络INT8量化优化算法。针对裁剪及量化后的YOLO V3算法,完成了基于Xilinx公司的UltraScale+MPSoC系列的XCZU7EV器件验证平台的智能算法程序部署,并利用无人车的可见光数据集和红外数据集进行了仿真验证。结果表明,YOLO V3算法在两类优化算法有效结合并保持网络精度的前提下,在无人车嵌入式硬件平台上可获得4.5倍的加速比,能够满足无人车地面目标识别的精度与实时性要求。所提出的优化算法思想为神经网络在嵌入式硬件平台上的部署提供了新的技术思路。 展开更多
关键词 无人车 CNN目标识别 硬件资源评估 网络优化 int8量化 FPGA加速
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部