针对金属表面缺陷检测任务中检测目标小、尺度变化大、背景复杂等问题,提出了一种基于RTDETR(real-time detection Transformer)的改进模型——HAS-DETR(high accurancy for small object-DETR)。HAS-DETR通过在骨干网络中引入复合差分...针对金属表面缺陷检测任务中检测目标小、尺度变化大、背景复杂等问题,提出了一种基于RTDETR(real-time detection Transformer)的改进模型——HAS-DETR(high accurancy for small object-DETR)。HAS-DETR通过在骨干网络中引入复合差分卷积,增强对小目标的特征提取能力;构建双重多尺度特征融合模块,有效捕获全局语义信息与细节特征,解决目标尺度变化大的问题;设计全局多尺度注意力机制,替代AIFI(attentionbased intra-scale feature interaction)模块中的多头注意力机制,提高模型在复杂背景和多尺度目标场景中的鲁棒性和精确度。在金属表面缺陷数据集上,HAS-DETR在mAP50和mAP50-95上分别较RT-DETR提升了6.5%和4.5%;在公开ADPPP数据集上,mAP50提升了2%,mAP50-95提升了1.3%。实验结果表明:HAS-DETR在保持较高检测效率的同时,有效提升了在复杂背景中对小目标的检测精度,具有良好的实际应用前景。展开更多
针对遥感图像小目标检测中存在的目标尺寸过小、背景复杂、特征难以提取以及RT-DETR算法参数量过大、预测速度过慢、难以应用于实际生产等问题,提出了一种基于RT-DETR的轻量化改进算法LERT-DETR(Lightweight and Efficient Real-Time DE...针对遥感图像小目标检测中存在的目标尺寸过小、背景复杂、特征难以提取以及RT-DETR算法参数量过大、预测速度过慢、难以应用于实际生产等问题,提出了一种基于RT-DETR的轻量化改进算法LERT-DETR(Lightweight and Efficient Real-Time DEtection TRansformer)。首先,提出P-RepConv模块,替换主干网络BasicBlock中的卷积模块实现轻量化的同时提升精度。其中,PConv模块降低算法参数量,提高模型检测速度,融入的RepConv模块提高小目标检测精度,并且消除因减少参数量带来的精度下降、特征提取不完全等影响。其次,将DySample添加至上采样模块中。在不影响原有上采样功能的前提下,引入偏移量的计算,避免图像出现伪影问题影响特征的提取,进而导致准确度下降。最后,提出了DBBS-RepC3模块。利用多分支结构提升模型对特征的提取能力,以适应各种复杂场景,添加的EASPPF模块将单层平均池化改为多层平均池化融合,增强全局特征提取能力。在DIOR数据集上对不同算法进行对比实验,实验结果表明:LERT-DETR算法明显优于其他主流算法,相比RT-DETR,在数据集DIOR上的mAP@0.5提高了2.2%,参数量下降了29.4%,运算量减少了24.8%。展开更多
为了实现光照变化等复杂环境下果实的选择性采摘,该研究以黄瓜为研究对象,以RT-Detr为基线网络,提出了RT-Detr-EV模型。首先在主干网络中添加RepVGG模块,以加强网络特征提取能力,并减少推理时计算量;加入轻量化自注意力机制,减少计算量...为了实现光照变化等复杂环境下果实的选择性采摘,该研究以黄瓜为研究对象,以RT-Detr为基线网络,提出了RT-Detr-EV模型。首先在主干网络中添加RepVGG模块,以加强网络特征提取能力,并减少推理时计算量;加入轻量化自注意力机制,减少计算量,增加网络深度;最后使用MPDIoU(minimum point distance based intersection over union)替换原模型中的损失函数,加快模型的收敛,提高模型的检测准确率。研究表明,改进RT-Detr-EV的平均精度均值mAP50相较于原模型提升了3.2个百分点,检测速度相较原模型提升了17.4帧/s。与YOLOv7-X、YOLOv8-l相比,对非适宜采摘的黄瓜识别准确率分别提升4.6、6.5个百分点,检测速度分别提升了40.6、25帧/s,参数量分别减少了55.5%、27.3%。同时试验证明,模型对光照条件多种变化的采摘场景也具有一定的鲁棒性与泛化能力。该研究提出的RT-Detr-EV模型能够满足复杂生长环境黄瓜果实的实时检测需求,可为后续移动式选择性采摘的研究提供技术支持。展开更多
文摘针对金属表面缺陷检测任务中检测目标小、尺度变化大、背景复杂等问题,提出了一种基于RTDETR(real-time detection Transformer)的改进模型——HAS-DETR(high accurancy for small object-DETR)。HAS-DETR通过在骨干网络中引入复合差分卷积,增强对小目标的特征提取能力;构建双重多尺度特征融合模块,有效捕获全局语义信息与细节特征,解决目标尺度变化大的问题;设计全局多尺度注意力机制,替代AIFI(attentionbased intra-scale feature interaction)模块中的多头注意力机制,提高模型在复杂背景和多尺度目标场景中的鲁棒性和精确度。在金属表面缺陷数据集上,HAS-DETR在mAP50和mAP50-95上分别较RT-DETR提升了6.5%和4.5%;在公开ADPPP数据集上,mAP50提升了2%,mAP50-95提升了1.3%。实验结果表明:HAS-DETR在保持较高检测效率的同时,有效提升了在复杂背景中对小目标的检测精度,具有良好的实际应用前景。
文摘为了实现光照变化等复杂环境下果实的选择性采摘,该研究以黄瓜为研究对象,以RT-Detr为基线网络,提出了RT-Detr-EV模型。首先在主干网络中添加RepVGG模块,以加强网络特征提取能力,并减少推理时计算量;加入轻量化自注意力机制,减少计算量,增加网络深度;最后使用MPDIoU(minimum point distance based intersection over union)替换原模型中的损失函数,加快模型的收敛,提高模型的检测准确率。研究表明,改进RT-Detr-EV的平均精度均值mAP50相较于原模型提升了3.2个百分点,检测速度相较原模型提升了17.4帧/s。与YOLOv7-X、YOLOv8-l相比,对非适宜采摘的黄瓜识别准确率分别提升4.6、6.5个百分点,检测速度分别提升了40.6、25帧/s,参数量分别减少了55.5%、27.3%。同时试验证明,模型对光照条件多种变化的采摘场景也具有一定的鲁棒性与泛化能力。该研究提出的RT-Detr-EV模型能够满足复杂生长环境黄瓜果实的实时检测需求,可为后续移动式选择性采摘的研究提供技术支持。