针对遥感图像小目标检测中存在的目标尺寸过小、背景复杂、特征难以提取以及RT-DETR算法参数量过大、预测速度过慢、难以应用于实际生产等问题,提出了一种基于RT-DETR的轻量化改进算法LERT-DETR(Lightweight and Efficient Real-Time DE...针对遥感图像小目标检测中存在的目标尺寸过小、背景复杂、特征难以提取以及RT-DETR算法参数量过大、预测速度过慢、难以应用于实际生产等问题,提出了一种基于RT-DETR的轻量化改进算法LERT-DETR(Lightweight and Efficient Real-Time DEtection TRansformer)。首先,提出P-RepConv模块,替换主干网络BasicBlock中的卷积模块实现轻量化的同时提升精度。其中,PConv模块降低算法参数量,提高模型检测速度,融入的RepConv模块提高小目标检测精度,并且消除因减少参数量带来的精度下降、特征提取不完全等影响。其次,将DySample添加至上采样模块中。在不影响原有上采样功能的前提下,引入偏移量的计算,避免图像出现伪影问题影响特征的提取,进而导致准确度下降。最后,提出了DBBS-RepC3模块。利用多分支结构提升模型对特征的提取能力,以适应各种复杂场景,添加的EASPPF模块将单层平均池化改为多层平均池化融合,增强全局特征提取能力。在DIOR数据集上对不同算法进行对比实验,实验结果表明:LERT-DETR算法明显优于其他主流算法,相比RT-DETR,在数据集DIOR上的mAP@0.5提高了2.2%,参数量下降了29.4%,运算量减少了24.8%。展开更多
为了实现光照变化等复杂环境下果实的选择性采摘,该研究以黄瓜为研究对象,以RT-Detr为基线网络,提出了RT-Detr-EV模型。首先在主干网络中添加RepVGG模块,以加强网络特征提取能力,并减少推理时计算量;加入轻量化自注意力机制,减少计算量...为了实现光照变化等复杂环境下果实的选择性采摘,该研究以黄瓜为研究对象,以RT-Detr为基线网络,提出了RT-Detr-EV模型。首先在主干网络中添加RepVGG模块,以加强网络特征提取能力,并减少推理时计算量;加入轻量化自注意力机制,减少计算量,增加网络深度;最后使用MPDIoU(minimum point distance based intersection over union)替换原模型中的损失函数,加快模型的收敛,提高模型的检测准确率。研究表明,改进RT-Detr-EV的平均精度均值mAP50相较于原模型提升了3.2个百分点,检测速度相较原模型提升了17.4帧/s。与YOLOv7-X、YOLOv8-l相比,对非适宜采摘的黄瓜识别准确率分别提升4.6、6.5个百分点,检测速度分别提升了40.6、25帧/s,参数量分别减少了55.5%、27.3%。同时试验证明,模型对光照条件多种变化的采摘场景也具有一定的鲁棒性与泛化能力。该研究提出的RT-Detr-EV模型能够满足复杂生长环境黄瓜果实的实时检测需求,可为后续移动式选择性采摘的研究提供技术支持。展开更多
文摘为了实现光照变化等复杂环境下果实的选择性采摘,该研究以黄瓜为研究对象,以RT-Detr为基线网络,提出了RT-Detr-EV模型。首先在主干网络中添加RepVGG模块,以加强网络特征提取能力,并减少推理时计算量;加入轻量化自注意力机制,减少计算量,增加网络深度;最后使用MPDIoU(minimum point distance based intersection over union)替换原模型中的损失函数,加快模型的收敛,提高模型的检测准确率。研究表明,改进RT-Detr-EV的平均精度均值mAP50相较于原模型提升了3.2个百分点,检测速度相较原模型提升了17.4帧/s。与YOLOv7-X、YOLOv8-l相比,对非适宜采摘的黄瓜识别准确率分别提升4.6、6.5个百分点,检测速度分别提升了40.6、25帧/s,参数量分别减少了55.5%、27.3%。同时试验证明,模型对光照条件多种变化的采摘场景也具有一定的鲁棒性与泛化能力。该研究提出的RT-Detr-EV模型能够满足复杂生长环境黄瓜果实的实时检测需求,可为后续移动式选择性采摘的研究提供技术支持。