期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
使用TensorRT进行深度学习推理 被引量:29
1
作者 周立君 刘宇 +2 位作者 白璐 刘飞 王亚伟 《应用光学》 CAS CSCD 北大核心 2020年第2期337-341,共5页
TensorRT是一个高性能的深度学习推理平台。它包括一个深度学习推理优化器和运行时为深度学习推理应用程序提供低延迟和高吞吐量。给出了一个使用TensorRT快速构建计算管道的例子,实现通过TensorRT执行智能视频分析的典型应用。该示例... TensorRT是一个高性能的深度学习推理平台。它包括一个深度学习推理优化器和运行时为深度学习推理应用程序提供低延迟和高吞吐量。给出了一个使用TensorRT快速构建计算管道的例子,实现通过TensorRT执行智能视频分析的典型应用。该示例演示了使用片上解码器进行解码、使用片上标量进行视频缩放和GPU计算的4个并发视频流。为了演示的简单性,只有一个通道使用NVIDIA TensorRT执行对象标识,并在标识的对象周围生成包围框。该示例还使用视频转换器函数进行各种格式转换,使用EGLImage来演示缓冲区共享和图像显示。最后采用GPU卡V100对ResNet网络进行TensorRT加速性能的实际测试,结果表明TensorRT能够使吞吐量提升大约15倍。 展开更多
关键词 tensorrt 深度学习推理 对象检测 统一计算设备架构
在线阅读 下载PDF
基于改进YOLOv5s和TensorRT部署的鱼道过鱼监测 被引量:18
2
作者 李健源 柳春娜 +1 位作者 卢晓春 吴必朗 《农业机械学报》 EI CAS CSCD 北大核心 2022年第12期314-322,共9页
为实现在复杂水体下对鱼道过鱼进行监测,提出了一种基于YOLOv5s的改进模型,并用TensorRT部署应用于某水电站鱼道现场。首先,针对水下图像模糊、目标检测困难的问题,提出了将Swin Transformer(STR)作为检测层,提升了模型对目标的检测能力... 为实现在复杂水体下对鱼道过鱼进行监测,提出了一种基于YOLOv5s的改进模型,并用TensorRT部署应用于某水电站鱼道现场。首先,针对水下图像模糊、目标检测困难的问题,提出了将Swin Transformer(STR)作为检测层,提升了模型对目标的检测能力;其次,针对鱼群密集、图像信息少的问题,将Efficient channel attention(ECA)注意力机制作为主干特征提取网络C3结构的Bottleneck,减少了计算参数并提升了检测精度;然后,针对检测目标定位差、回归不收敛的问题,将Focal and efficient IOU loss(FIOU)作为模型损失函数,优化了模型整体性能;最后将模型部署在TensorRT框架进行优化,处理速度得到了大幅度提升。基于实际采集的复杂水体数据集进行实验,结果表明,本文算法mAP为91.9%,单幅图像处理时间为10.4 ms,在相同条件下,精度比YOLOv5s提升4.8个百分点,处理时间减少0.4 ms。模型使用TensorRT部署后单幅图像推理时间达到2.3 ms,在不影响检测精度的前提下,推理速度提高4.5倍。综上,本文算法模型在保证快速检测的基础上,具有较高的准确性,更适用于复杂水体下鱼道过鱼监测。 展开更多
关键词 鱼道过鱼监测 YOLOv5s 损失函数 tensorrt
在线阅读 下载PDF
基于深度学习的三叉神经区域自动检测及TensorRT加速 被引量:4
3
作者 张倩宇 贾维 彭博 《太赫兹科学与电子信息学报》 2021年第6期1065-1069,共5页
利用深度学习技术对颅脑核磁共振图像(MRI)中三叉神经区域进行自动检测可为后续三叉神经分割提供可靠的输入图像,有效解决了人工筛选三叉神经对临床医生专业素养要求高、耗时长等弊端。采用YOLO网络自动检测颅脑核磁共振图像中三叉神经... 利用深度学习技术对颅脑核磁共振图像(MRI)中三叉神经区域进行自动检测可为后续三叉神经分割提供可靠的输入图像,有效解决了人工筛选三叉神经对临床医生专业素养要求高、耗时长等弊端。采用YOLO网络自动检测颅脑核磁共振图像中三叉神经区域提高推理速度,并系统性地评估NVIDIA TensorRT框架在不同计算平台下的推理性能。实验结果表明,通过YOLO目标检测网络能够准确检测出三叉神经所在的区域,同时在NVIDIATensorRT框架下,当输入的颅脑MRI分辨率为(204×204)时,CPU平台、嵌入式GPU平台、桌面GPU平台及专业GPU计算卡平台下,YOLOv2网络检测优化后的三叉神经目标的每秒帧率分别可达到0.1 FPS,23.4 FPS,112.5FPS和793.7 FPS,这为后续开发便携式的三叉神经分割设备提供了可参考的重要依据。 展开更多
关键词 颅脑核磁共振图像 目标检测网络 三叉神经 tensorrt 加速
在线阅读 下载PDF
改进YOLOv4的蚕豆苗检测算法及TensorRT加速 被引量:5
4
作者 杨肖 袁锐波 +3 位作者 李兆旭 曹志鹏 林红刚 朱正 《重庆理工大学学报(自然科学)》 CAS 北大核心 2023年第3期312-320,共9页
提出一种基于改进YOLOv4网络的轻量化蚕豆苗检测方法,使用MobileNet网络代替YOLOv4原主干网络CSPDarknet53,并用深度可分离卷积替换骨干网络,加强特征提取网络和预测层的普通卷积;改进网络训练后,利用NVIDIA的加速引擎TensorRT对网络结... 提出一种基于改进YOLOv4网络的轻量化蚕豆苗检测方法,使用MobileNet网络代替YOLOv4原主干网络CSPDarknet53,并用深度可分离卷积替换骨干网络,加强特征提取网络和预测层的普通卷积;改进网络训练后,利用NVIDIA的加速引擎TensorRT对网络结构进行重构和优化,提高GPU运行效率,在嵌入式平台上实现模型的推理与加速;实验结果显示:改进网络体积缩小至原网络体积约20%,AP仅下降3.14%,但检测速度是原网络的4倍。在Jetson Nano嵌入式平台上,改进后的网络模型推理速度达到20.3FPS;表明提出的网络模型能支持深度学习模型在嵌入式平台的实时应用。 展开更多
关键词 目标检测 YOLOv4 tensorrt 嵌入式平台
在线阅读 下载PDF
基于TensorRT的植物叶片病害实时检测分类模型优化 被引量:3
5
作者 徐泽华 李坚孝 +3 位作者 邓树源 吴家隐 高嘉晖 潘明毅 《计算机系统应用》 2023年第2期94-101,共8页
为了提高边缘计算设备对植物叶片病害检测的识别速率,本研究采用卷积神经网络搭建了植物叶片目标识别模型和植物叶片病害分类模型,并且使用OpenCV将两个模型整合成植物叶片病害检测系统.通过SSD(single shot multibox detector)算法对... 为了提高边缘计算设备对植物叶片病害检测的识别速率,本研究采用卷积神经网络搭建了植物叶片目标识别模型和植物叶片病害分类模型,并且使用OpenCV将两个模型整合成植物叶片病害检测系统.通过SSD(single shot multibox detector)算法对植物叶片的目标区域进行定位并裁剪,再利用植物叶片病害分类模型对裁剪的植物叶片区域进行病害分类.同时,通过TensorRT加速推理对分类模型进行优化处理,以及在同一台主机设备和Jetson Nano计算平台上,对优化前后的模型进行了对比实验.实验表明,在同一主机设备上优化后的植物分类模型识别速率提升22倍.同时,优化后的分类模型使植物叶片病害检测系统识别速率提升7倍.而将优化后的系统部署在Jetson Nano计算平台上,对比优化前的植物叶片病害检测速率提升10倍,实现了实时的植物叶片病害检测. 展开更多
关键词 卷积神经网络(CNN) 植物叶片检测 OPENCV tensorrt
在线阅读 下载PDF
基于TensorRT加速推理的电梯内电动车检测系统
6
作者 高胥智 魏伟波 王静 《计算机科学与应用》 2022年第4期847-857,共11页
电动车入户充电存在安全隐患,容易发生火灾,针对高层住户电动车入户充电的问题,本文提出了基于TensorRT加速推理的电梯内电动车检测系统,通过在电梯内部署电动车检测设备来有效遏制高层住户电动车入户的问题。该系统使用YOLOX网络训练... 电动车入户充电存在安全隐患,容易发生火灾,针对高层住户电动车入户充电的问题,本文提出了基于TensorRT加速推理的电梯内电动车检测系统,通过在电梯内部署电动车检测设备来有效遏制高层住户电动车入户的问题。该系统使用YOLOX网络训练目标检测模型,数据类型分为电动摩托车、电动自行车与自行车三类,通过模型迁移将训练好的目标检测模型部署到JetsonNano设备上,该设备通过Jetson-GPIO来做到对电梯的控制。实验结果表明,基于TensorRT加速推理的电梯内电动车检测系统,在性能与识别准确率上均优于传统方法,该设备能够有效遏制高层住户电动车入户问题。 展开更多
关键词 YOLOX tensorrt JetsonNano 目标检测 深度学习
在线阅读 下载PDF
基于轻量化YOLOv7的带式输送机输送带撕裂检测算法 被引量:2
7
作者 安龙辉 王满利 张长森 《电子测量技术》 北大核心 2025年第1期64-75,共12页
针对矿井下输送机特殊运行环境下输送带撕裂的检测难题,提出一种线激光辅助下的改进YOLOv7轻量化检测算法。首先,针对输送带撕裂以小目标为主,不需要最大的检测层,从而简化网络模型,达到减小模型体积和减少参数量的目的。此外,采用动态... 针对矿井下输送机特殊运行环境下输送带撕裂的检测难题,提出一种线激光辅助下的改进YOLOv7轻量化检测算法。首先,针对输送带撕裂以小目标为主,不需要最大的检测层,从而简化网络模型,达到减小模型体积和减少参数量的目的。此外,采用动态非单调FM的Wise-IoU损失函数,使模型更加关注普通质量的样本,提高模型检测性能。然后,使用LAMP剪枝方法,提高模型的计算速度并降低计算复杂度,实现检测网络的轻量化,采用通道知识蒸馏无损提高模型精度,最后使用TensorRT加速模型,达到更快的检测速度。实验结果表明,与基准模型相比,改进后模型的参数量和计算量分别减少了86.8%、49.2%,mAP@0.5:0.95达到了62.4%,并且检测速度提升151.0 fps,模型大小从71.3 MB减少到12.8 MB。经过改进后的模型,提高了对输送带撕裂故障检测的准确性和实时性。 展开更多
关键词 YOLOv7 目标检测 Wise-IoU LAMP剪枝 通道知识蒸馏 tensorrt
原文传递
基于改进YOLOv5的硅片缺陷检测
8
作者 雷应明 王安红 +2 位作者 景灏 卜东寒 杨亚坤 《太原科技大学学报》 2025年第5期439-446,共8页
太阳能硅片在流水线生产过程中,很容易产生尺寸分布不均衡缺陷。为满足硅片在线缺陷检测的多尺寸、高精度及高速度要求,提出了改进YOLOv5的目标检测网络。首先,利用多层空洞卷积,对浅层特征网络提取层进行优化,以增强对小目标的特征提... 太阳能硅片在流水线生产过程中,很容易产生尺寸分布不均衡缺陷。为满足硅片在线缺陷检测的多尺寸、高精度及高速度要求,提出了改进YOLOv5的目标检测网络。首先,利用多层空洞卷积,对浅层特征网络提取层进行优化,以增强对小目标的特征提取能力;其次,将优化后的模块加入TensorRT的网络结构中,以实现加速推理;最后,在数据集预处理过程中,将极大目标分成两个中等目标进行检测,以提升对极大目标的检测性能。实验结果表明,对比YOLOv5s,检测精度提升了2.63%,在基本不损失精度的情况下,通过TensorRT加速后的推理时间仅需约23 ms,能够很好满足硅片在线缺陷检测的应用。 展开更多
关键词 深度学习 小目标检测 YOLOv5 空洞卷积 tensorrt
在线阅读 下载PDF
一种低功耗嵌入式的YOLOv8-NANO智能垃圾快速分拣系统
9
作者 竺春祥 舒红 +1 位作者 杨波 王斌锐 《科学技术与工程》 北大核心 2025年第9期3806-3812,共7页
为解决垃圾自动分拣难题,设计了以人工智能计算平台Jetson NANO和YOLOv8算法为基础的生活垃圾智能分拣系统。首先,采用轻量化YOLOv8多目标检测算法将垃圾分为四大类并实现在有遮挡情况下的准确识别;其次,基于CoreXY坐标变换算法实现机... 为解决垃圾自动分拣难题,设计了以人工智能计算平台Jetson NANO和YOLOv8算法为基础的生活垃圾智能分拣系统。首先,采用轻量化YOLOv8多目标检测算法将垃圾分为四大类并实现在有遮挡情况下的准确识别;其次,基于CoreXY坐标变换算法实现机械爪抓取的最佳角度判断与垃圾精准抓取;最后,基于TensorRT优化技术实现轻量化YOLOv8多目标检测算法在NANO硬件平台的部署,完成基于YOLOv8-NANO的四大类垃圾智能分拣系统整体构建。实验验证结果表明:在自制的包含四大类共13小类垃圾测试中,分拣系统可以有效实现单目标与多目标的检测,检测mAP0.5:0.95(当IoU阈值在0.5~0.95逐步增加时的平均精度)为97.3%,目标检测速度达到30.6帧/s,垃圾分拣速度最快可达6件/min。 展开更多
关键词 YOLOv8 Jetson NANO tensorrt部署 多目标检测 识别抓取
在线阅读 下载PDF
基于Jetson Nano的头盔佩戴检测系统设计
10
作者 彭梓洋 周顺勇 +3 位作者 陆欢 张鑫 张航领 罗扬铭 《四川轻化工大学学报(自然科学版)》 2025年第1期69-76,共8页
当前,许多用于检测头盔佩戴情况的算法在低算力嵌入式设备上无法满足实时检测的需求,从而限制了头盔佩戴检测技术的广泛应用。针对这一难题,本文提出了一种针对Jetson Nano开发板的TensorRT优化部署方法。首先,采用Int8量化、层间融合... 当前,许多用于检测头盔佩戴情况的算法在低算力嵌入式设备上无法满足实时检测的需求,从而限制了头盔佩戴检测技术的广泛应用。针对这一难题,本文提出了一种针对Jetson Nano开发板的TensorRT优化部署方法。首先,采用Int8量化、层间融合和张量融合等技术提升算法性能和加速推理速度;然后,利用TensorRT的自动化校准过程,使算法性能损失最小,解决使用Int8导致信息丢失的问题。实验表明,将头盔佩戴检测算法模型部署到Jetson Nano嵌入式设备中后,mAP@0.5达到98.63%,推理总耗时从320.52 ms减少到64.11 ms,减少了80%。这一改进有效地解决了算法在低算力嵌入式设备下部署推理的实时性不足的问题,为头盔佩戴检测技术的推广应用提供了新思路。 展开更多
关键词 嵌入式开发 tensorrt Int8量化 层间融合 张量融合
在线阅读 下载PDF
定时链条安装质量识别系统的设计与实现
11
作者 孙昊 张兵祥 +2 位作者 葛春峰 张义龙 冯瑞 《现代制造技术与装备》 2025年第6期5-8,共4页
以M320发动机装配线自动化改造项目为背景,提出基于视觉检测与协作机器人联动的智能装配解决方案。通过集成产线可编程逻辑控制器(Programmable Logic Controller,PLC)控制系统,构建融合YOLOv11目标检测算法的视觉识别体系,实现关键零... 以M320发动机装配线自动化改造项目为背景,提出基于视觉检测与协作机器人联动的智能装配解决方案。通过集成产线可编程逻辑控制器(Programmable Logic Controller,PLC)控制系统,构建融合YOLOv11目标检测算法的视觉识别体系,实现关键零件特征提取以及链条装配质量判定。采用TensorRT加速引擎部署模型,并开发配套人工智能(Artificial Intelligence,AI)服务网页平台,实现数据管理和检索功能。该项目形成的标准化智能检测流程为AI技术在工业场景的推广和应用提供了可借鉴的方法框架和技术路径。 展开更多
关键词 定时链条安装 质量识别系统 YOLOv11 tensorrt
在线阅读 下载PDF
基于改进 YOLOv7 的煤矿带式输送机异物识别 被引量:36
12
作者 毛清华 李世坤 +2 位作者 胡鑫 薛旭升 姚丽杰 《工矿自动化》 北大核心 2022年第12期26-32,共7页
带式输送机煤流中会掺杂锚杆、角铁、木条、矸石、大块煤等异物,易导致输送带撕裂、转接处堵塞甚至断带。针对带式输送机巡检机器人难以在井下光照不均及带式输送机高速运行环境中高效、准确识别异物及模型部署不便等问题,以及YOLOv7模... 带式输送机煤流中会掺杂锚杆、角铁、木条、矸石、大块煤等异物,易导致输送带撕裂、转接处堵塞甚至断带。针对带式输送机巡检机器人难以在井下光照不均及带式输送机高速运行环境中高效、准确识别异物及模型部署不便等问题,以及YOLOv7模型对目标特征提取能力高,但识别速度较慢的特点,提出了一种基于改进YOLOv7的煤矿带式输送机异物识别方法。运用限制对比度自适应直方图均衡化方法对采集的带式输送机监控图像进行增强,提高图像中物体轮廓的清晰度;对YOLOv7模型进行改进,通过在主干提取网络引入轻量化无参注意力机制,提高模型对图像复杂背景的抗干扰能力和对异物特征的提取能力,同时引入深度可分离卷积代替主干特征提取网络中的普通卷积,提高异物识别速度;使用TensorRT引擎将训练后的改进YOLOv7模型进行转换并部署在NVIDIA Jetson Xavier NX上,实现了模型的加速。对煤矿井下分辨率为1920×1080的带式输送机监控视频进行识别,实验结果表明:改进YOLOv7模型的识别效果优于YOLOv5L和YOLOv7模型,识别精确率达92.8%,识别速度为25.64帧/s,满足精确、高效识别带式输送机异物的要求。 展开更多
关键词 带式输送机 异物识别 YOLOv7 无参注意力机制 深度可分离卷积 tensorrt
在线阅读 下载PDF
高性能YOLOv5:面向嵌入式平台高性能目标检测算法研究 被引量:6
13
作者 刘乔寿 赵志源 +1 位作者 王均成 皮胜文 《电子与信息学报》 EI CSCD 北大核心 2023年第6期2205-2215,共11页
针对目前深度学习单阶段检测算法综合性能不平衡以及在嵌入式设备难以部署等问题,该文提出一种面向嵌入式平台的高性能目标检测算法。基于只看1次5代(YOLOv5)网络,改进算法首先在主干网络部分采用设计的空间颈块代替原有的焦点模块,结... 针对目前深度学习单阶段检测算法综合性能不平衡以及在嵌入式设备难以部署等问题,该文提出一种面向嵌入式平台的高性能目标检测算法。基于只看1次5代(YOLOv5)网络,改进算法首先在主干网络部分采用设计的空间颈块代替原有的焦点模块,结合改进的混洗网络2代替换原有的跨级局部暗网络,减小空间金字塔池化(SPP)的内核尺寸,实现了主干网络的轻量化。其次,颈部采用了基于路径聚合网络(PAN)设计的增强型路径聚合网络(EPAN),增加了P6大目标输出层,提高了网络的特征提取能力。然后,检测头部分采用以自适应空间特征融合(ASFF)为基础设计的自适应空洞空间特征融合(A-ASFF)来替代原有的检测头,解决了物体尺度变化问题,在少量增加额外开销情况下大幅提升检测精度。最后,函数部分采用高效交并比(EIoU)代替完整交并比(CIoU)损失函数,采用S型加权线性单元(SiLU)代替HardSwish激活函数,提升了模型的综合性能。实验结果表明,与YOLOv5-S相比,该文提出的同版本算法在mAP@.5,mAP@.5:.95上分别提高了4.6%和6.3%,参数量降低了43.5%,计算复杂度降低了12.0%,在Jetson Nano平台上使用原模型和TensorRT加速模型进行速度评估,分别减少了8.1%和9.8%的推理延迟。该文所提算法的综合指标超越了众多优秀的目标检测网络,对嵌入式平台更为友好,具有实际应用意义。 展开更多
关键词 目标检测 YOLOv5 混洗网络2代 自适应空间特征融合 嵌入式设备 tensorrt加速
在线阅读 下载PDF
改进YOLOv5s的车辆目标检测算法研究与实现 被引量:2
14
作者 周金治 景瑞琦 +1 位作者 吴静 刘梦宇 《计算机与数字工程》 2023年第11期2546-2552,2579,共8页
针对在实际交通场景中对车辆目标检测算法有占用资源小、保证实时性和准确率高的要求,提出了一种基于改进YOLOv5s的车辆目标检测算法。首先,引入GhostNet改进YOLOv5s的Backbone,降低了网络的计算量,提高了检测速度;其次,融合CBAM注意力... 针对在实际交通场景中对车辆目标检测算法有占用资源小、保证实时性和准确率高的要求,提出了一种基于改进YOLOv5s的车辆目标检测算法。首先,引入GhostNet改进YOLOv5s的Backbone,降低了网络的计算量,提高了检测速度;其次,融合CBAM注意力机制,改善在各种天气、光照情况下难以被准确检测的问题;然后,使用Soft-NMS代替NMS,减少了交通拥堵等情况造成的漏检问题;最后,对改进后的算法进行了对比消融实验,验证其性能,再部署到嵌入式设备端测试。根据实验结果,改进算法在保证较高的平均精度的情况下,模型资源占用降低了34.76%,在嵌入式平台上的帧率可以达到29 frame/s,可以达到实际应用的要求。 展开更多
关键词 YOLOv5 目标检测 注意力机制 嵌入式平台 tensorrt
在线阅读 下载PDF
基于改进YOLOv7模型的柑橘表面缺陷在线检测 被引量:31
15
作者 贾雪莹 赵春江 +5 位作者 周娟 王庆艳 梁晓婷 何鑫 黄文倩 张驰 《农业工程学报》 EI CAS CSCD 北大核心 2023年第23期142-151,共10页
柑橘表面缺陷是水果检测分级的重要依据,针对传统柑橘表面缺陷检测方法效率低、精度低等问题,该研究提出一种柑橘表面缺陷的实时检测方法。该方法首先对柑橘图像进行图像增强,然后利用提出的YOLOv7-CACT模型对柑橘表面缺陷进行检测,该... 柑橘表面缺陷是水果检测分级的重要依据,针对传统柑橘表面缺陷检测方法效率低、精度低等问题,该研究提出一种柑橘表面缺陷的实时检测方法。该方法首先对柑橘图像进行图像增强,然后利用提出的YOLOv7-CACT模型对柑橘表面缺陷进行检测,该模型在YOLOv7模型骨干网络中引入坐标注意力模块(coordinate attention,CA),从而提高模型对缺陷部分的关注度。在网络头部引入CT(contextual transformer,CT)模块,融合静态和动态上下文表征特征,从而增强缺陷部分特征表达能力。通过试验确定CA模块和CT模块的最佳位置。改进后的YOLOv7-CACT模型检测结果平均精度均值(mean average precision,mAP)相较于原始模型增加了4.1个百分点,达到91.1%,满足了实际生产中对柑橘缺陷检测精度的要求。最后将基于YOLOv7-CACT的柑橘检测模型通过TensorRT进行部署,试验结果表明模型的推理时间满足柑橘生产线10个/s的实时分选要求,总体的检测精度达到94.4%,为柑橘表面缺陷在线检测提供了一种精准的实时检测方法。 展开更多
关键词 无损检测 柑橘 表面缺陷 YOLOv7 深度学习 注意力机制 tensorrt
在线阅读 下载PDF
基于LEE-YOLOv7的输电线路边缘端实时缺陷检测方法 被引量:10
16
作者 胡晨龙 裴少通 +4 位作者 刘云鹏 杨文杰 杨瑞 张行远 刘海峰 《高电压技术》 EI CAS CSCD 北大核心 2024年第11期5047-5057,I0012,I0013,共13页
边缘计算设备已广泛应用于无人机输电线路巡检中,但边缘端设备较低的功率及算力限制了其检测速度与精度,针对以上问题,该文对YOLOv7目标检测算法进行改进,提出一种基于LEE-YOLOv7的输电线路边缘端缺陷诊断方法。首先,采用Mosaic-9数据... 边缘计算设备已广泛应用于无人机输电线路巡检中,但边缘端设备较低的功率及算力限制了其检测速度与精度,针对以上问题,该文对YOLOv7目标检测算法进行改进,提出一种基于LEE-YOLOv7的输电线路边缘端缺陷诊断方法。首先,采用Mosaic-9数据增强方法改进训练阶段的输入端,提高网络的泛化能力;而后引入LCnet网络改造主干网络部分,减少冗余参数,轻量化网络;然后,采用Meta-ACON激活函数及Wise-IoU损失函数优化网络;最后在推理过程中使用Deepstream技术调用TensorRT模块实现模型重构、优化及加速。经实验验证,LEE-YOLOv7对10种常见输电线路多尺寸缺陷的识别平均准确率达到92.3%,相比原版YOLOv7算法提高了2.8%,且检测速度提升了38帧/s,达到53帧/s。采用Deepstream调用TensorRT模块进行推理过程的优化加速后,在Nvidia Jetson Xavier NX边缘端模块上,实现了91.2%的平均准确度及79帧/s的检测速度,满足了边缘端准确实时的输电线路缺陷检测要求。 展开更多
关键词 边缘计算 输电线路 Deepstream 缺陷检测 深度学习 tensorrt
原文传递
一种嵌入式GPU上的实时图像语义分割方法 被引量:4
17
作者 董建升 袁景凌 钟忺 《小型微型计算机系统》 CSCD 北大核心 2019年第11期2445-2449,共5页
复杂的深度学习网络在嵌入式平台上的推理速度较低,很难满足实际应用需求.因此针对自动驾驶、智能机器人等实时性应用背景,提出了一个轻量级图像语义分割网络,并利用NVIDIA的推理加速器TensorRT进行合并层、精度校准、并行优化等操作,... 复杂的深度学习网络在嵌入式平台上的推理速度较低,很难满足实际应用需求.因此针对自动驾驶、智能机器人等实时性应用背景,提出了一个轻量级图像语义分割网络,并利用NVIDIA的推理加速器TensorRT进行合并层、精度校准、并行优化等操作,提高模型的计算效率,在嵌入式平台上实现了对深度学习模型的推理加速.实验结果表明,提出的模型在Cityscapes数据集上取得了72. 17%的m Io U,对于尺寸为512×1024的输入图像,经过TensorRT的推理加速后,在嵌入式平台NVIDIA Jetson Xavier上达到了45 FPS的推理速度,该速度约为原模型的1. 8倍.提出的模型和优化方法在保留较高准确度的前提下,实现了嵌入式平台上的实时图像语义分割,为深度学习模型在嵌入式平台上的实时性应用提供了支持. 展开更多
关键词 语义分割 深度学习 嵌入式GPU tensorrt
在线阅读 下载PDF
基于改进YOLOv3的机载平台目标检测算法 被引量:15
18
作者 严开忠 马国梁 +2 位作者 许立松 尚海鹏 于睿 《电光与控制》 CSCD 北大核心 2021年第5期70-74,共5页
针对小型智能侦察无人机机载平台存在的计算力受限、检测速度较慢的问题,提出了一种基于YOLOv3改进的目标检测算法。首先引入深度可分离卷积改进YOLOv3的骨干网络,降低网络的参数和计算量,提高算法的检测速度,再根据机载视角下目标形状... 针对小型智能侦察无人机机载平台存在的计算力受限、检测速度较慢的问题,提出了一种基于YOLOv3改进的目标检测算法。首先引入深度可分离卷积改进YOLOv3的骨干网络,降低网络的参数和计算量,提高算法的检测速度,再根据机载视角下目标形状的特点,预置K-means产生先验框的初始聚类中心,并在边框回归中引入CIoU损失函数,将DIoU与NMS结合,改善YOLOv3对密集目标的漏检问题,最后再通过TensorRT优化加速后部署到英伟达Jetson TX2机载计算平台。实验结果表明,所改进的算法在验证集上的平均精度均值(MAP)达到了82%,检测速度从3.4帧/s提升到16帧/s,满足实时性要求。 展开更多
关键词 目标检测 侦察无人机 YOLOv3 深度可分离卷积 DIoU tensorrt
在线阅读 下载PDF
安全帽佩戴检测网络模型的轻量化设计 被引量:8
19
作者 郭奕裕 周箩鱼 《计算机工程》 CAS CSCD 北大核心 2023年第4期312-320,共9页
现有的安全帽佩戴检测网络模型存在准确率低、推理速度慢、部署到边缘计算设备时精度和实时性均达不到应用要求等问题。提出一种轻量化设计的DT-YOLO模型,对YOLOv4-Tiny目标检测模型进行改进,通过增加一个检测层提高模型在密集场景下对... 现有的安全帽佩戴检测网络模型存在准确率低、推理速度慢、部署到边缘计算设备时精度和实时性均达不到应用要求等问题。提出一种轻量化设计的DT-YOLO模型,对YOLOv4-Tiny目标检测模型进行改进,通过增加一个检测层提高模型在密集场景下对小目标的检测能力,并引入空间金字塔池化模块,提高模型对不同尺寸目标的检测能力。使用局部稀疏因子衰减算法进行稀疏化训练,从而使经过稀疏化训练后模型的平均精度均值(mAP)得到提高。根据缩放系数判断通道的重要性,并进行模型的通道剪枝,压缩模型的大小和计算量。使用TensorRT推理加速引擎进行网络层水平和垂直融合,消除拼接层操作,并将参数压缩成16位浮点型,提高模型的推理速度,最后在Jeston Nano边缘计算设备上实现模型部署。实验结果表明,与YOLOv4-Tiny模型相比,DT-YOLO模型的mAP提高了3.6个百分点,模型大小减少了83.5%,帧率提高137.7%,能够满足安全帽佩戴检测的要求。 展开更多
关键词 安全帽佩戴检测 YOLOv4-Tiny模型改进 局部稀疏因子衰减 模型压缩 tensorrt推理加速引擎 Jeston Nano边缘计算设备
在线阅读 下载PDF
复杂环境下煤矿井下胶带运输异物在线检测算法优化与分析 被引量:5
20
作者 高敏 李玲 +2 位作者 张辉 曹意宏 叶贵川 《煤炭工程》 北大核心 2024年第6期174-180,共7页
为解决煤矿井下胶带异物检测受煤尘干扰、光线不均、胶带高速运动造成传统检测算法精度低等问题,文章基于YOLOv7对矿井胶带异物检测算法进行优化。首先,通过自适应对比度增强算法,强化胶带监控图像对比度,提高目标图像轮廓清晰度;其次,... 为解决煤矿井下胶带异物检测受煤尘干扰、光线不均、胶带高速运动造成传统检测算法精度低等问题,文章基于YOLOv7对矿井胶带异物检测算法进行优化。首先,通过自适应对比度增强算法,强化胶带监控图像对比度,提高目标图像轮廓清晰度;其次,在主干提取网络中提出多尺度混合残差注意力机制,增强YOLOv7对异物特征提取能力与对背景干扰能力;最后,采用加权双向特征金字塔网络与4检测头输出模型预测结果,提升网络对不同尺寸异物检测效率。通过实验可得,改进后的YOLOv7模型对井下胶带异物识别精度和速度优于YOLOv5、YOLOv7,对井下胶带异物识别精度和识别速度分别为93.6%、26 f/s。识别平均准确率相较于YOLOv5模型、YOLOv7模型分别提高了3.9%,3.1%;平均召回率分别提高了4.1%,3.4%;检测时间分别有0.009 s, 0.005 s的提升。 展开更多
关键词 异物检测 YOLOv7 注意力机制 小目标检测 tensorrt
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部