交通标志在检测过程中,因受天气和光照强度的影响,导致检测时出现错检、漏检等问题,针对此问题提出一种融合空间信息的交通标志检测算法。首先,在网络中使用坐标卷积,增强网络对坐标位置信息的敏锐性。其次,在主干特征提取中加入坐标注...交通标志在检测过程中,因受天气和光照强度的影响,导致检测时出现错检、漏检等问题,针对此问题提出一种融合空间信息的交通标志检测算法。首先,在网络中使用坐标卷积,增强网络对坐标位置信息的敏锐性。其次,在主干特征提取中加入坐标注意力机制,可以更好地关注融合处的空间位置信息。在特征融合部分使用多尺度加权融合网络和金字塔池化,利用加权计算和跳跃连接的方式,增强低层与高层之间的语义信息融合效果。最后,使用边框回归损失函数(Scalable Intersection over Union Loss,SIoU)提高目标定位的准确性。在CCTSDB2021和GTSDB数据集上的实验结果显示,该方法在2种数据集上的平均精度(mean Average Precision,mAP)分别达到84.9%和98.5%,与主流检测模型对比有显著提升,较原模型分别提升了5.39个百分点和1.67个百分点,提高了交通标志的检测精度。展开更多
在交通监控中进行车辆检测过程时,存在车辆互相遮挡和远距离目标尺寸不足的问题,导致在检测中存在漏检和误检情况。针对此问题,文中提出一种基于YOLOv4(You Only Look Once version 4)的多尺度融合与注意力机制的交通车辆检测算法。在YO...在交通监控中进行车辆检测过程时,存在车辆互相遮挡和远距离目标尺寸不足的问题,导致在检测中存在漏检和误检情况。针对此问题,文中提出一种基于YOLOv4(You Only Look Once version 4)的多尺度融合与注意力机制的交通车辆检测算法。在YOLOv4的路径聚合网络中增加一个新的特征层进行多尺度特征融合,提升模型对底层纹理特征的提取能力。在YOLO Head检测头前嵌入ECA(Efficient Channel Attention)通道注意力模块,对聚合后的特征进行合理的抑制和增强,将CIoU(Complete Intersection over Union)损失函数替换为Soft-CIoU损失函数,提高小目标车辆对损失函数的贡献度。在公开车辆数据集UA-DETRAC与KITTI中的实验结果表明,相较于原YOLOv4算法,所提算法的平均精度分别提升了2.45百分点和1.14百分点,检测速度达到41.67 frame·s^(-1)。相较于其他先进算法,所提算法在检测精度上表现良好。展开更多
针对现有情感分类模型在深层情感理解上的局限性、传统注意力机制的单向性束缚以及自然语言处理(NLP)中的类别不平衡等问题,提出一种融合多尺度BERT(Bidirectional Encoder Representations from Transformers)特征和双向交叉注意力机...针对现有情感分类模型在深层情感理解上的局限性、传统注意力机制的单向性束缚以及自然语言处理(NLP)中的类别不平衡等问题,提出一种融合多尺度BERT(Bidirectional Encoder Representations from Transformers)特征和双向交叉注意力机制的情感分类模型M-BCA(Multi-scale BERT features with Bidirectional Cross Attention)。首先,从BERT的低层、中层和高层分别提取多尺度特征,以捕捉句子文本的表面信息、语法信息和深层语义信息;其次,利用三通道门控循环单元(GRU)进一步提取深层语义特征,从而增强模型对文本的理解能力;最后,为促进不同尺度特征之间的交互与学习,引入双向交叉注意力机制,从而增强多尺度特征之间的相互作用。此外,针对不平衡数据问题,设计数据增强策略,并采用混合损失函数优化模型对少数类别样本的学习。实验结果表明,在细粒度情感分类任务中,M-BCA表现优异。M-BCA在处理分布不平衡的多分类情感数据集时,它的性能显著优于大多数基线模型。此外,M-BCA在少数类别样本的分类任务中表现突出,尤其是在NLPCC 2014与Online_Shopping_10_Cats数据集上,MBCA的少数类别的Macro-Recall领先其他所有对比模型。可见,该模型在细粒度情感分类任务中取得了显著的性能提升,并适用于处理不平衡数据集。展开更多
针对热扎带钢表面缺陷面积较小、形态多样、边界模糊且背景复杂的问题,提出一种热轧带钢表面缺陷检测模型SFSP-YOLOv7。首先,通过改进k-means++聚类算法调整先验框维度,使用交并比(intersection over union, IoU)距离替换欧氏距离度量,...针对热扎带钢表面缺陷面积较小、形态多样、边界模糊且背景复杂的问题,提出一种热轧带钢表面缺陷检测模型SFSP-YOLOv7。首先,通过改进k-means++聚类算法调整先验框维度,使用交并比(intersection over union, IoU)距离替换欧氏距离度量,引入遗传算法(genetic algorithm, GA)以获得更具代表性的锚框尺寸,并提升模型的回归速度和小面积缺陷检测的精确度。其次,对于边界模糊且背景复杂的缺陷,提出一种目标检测边界框损失函数FocalSIoU,以减少模型中不必要特征的学习,加快检测速度,提升预测框的回归效果。最后,设计一种多尺度特征融合模块(multi-scale feature fusion module, MFFM),通过多尺度信息融合增强模型特征提取能力,提高小目标的检测精确度,并改善模型检测误检率。在模型Head结构中引入空到深(space to depth, SPD)卷积模块对模型进行改进,避免细粒度信息的丢失,降低目标漏检率。通过NEU-DET数据集进行验证,结果表明,SFSP-YOLOv7模型检测的平均精度均值(mean average precision, mAP)为78.3%,相比原YOLOv7模型提升了5.0个百分点,表明提出的检测方法具有有效性。展开更多
针对在复杂背景下输电线路多尺度缺陷目标检测精度较低的问题,文中提出一种基于改进YOLOv7(You Only Look Once version 7)的输电线路多类缺陷目标检测模型。对于复杂背景造成缺陷目标较低的问题,在Backbone部分引入改进的Swin Transfor...针对在复杂背景下输电线路多尺度缺陷目标检测精度较低的问题,文中提出一种基于改进YOLOv7(You Only Look Once version 7)的输电线路多类缺陷目标检测模型。对于复杂背景造成缺陷目标较低的问题,在Backbone部分引入改进的Swin Transformer模块,通过使用多头注意力机制提升对全局特征的提取效果来提高模型的检测精度。对于待检测目标的多尺度特性,在特征金字塔基础上引入自适应特征融合模块,提升了Neck部分特征融合网络对多类不同尺度缺陷目标的检测能力。使用SIoU(Structured Intersection over Union)损失函数在提高预测框回归精度的同时加快了模型的收敛。实验结果表明,相较于YOLOv5、YOLOv7和Faster R-CNN(Faster Region with Convolutional Neural Network)模型,改进YOLOv7模型具有较高的检测精度,其平均检测精度可达96.4%,检测速度为29.6 frame·s^(-1),能够为输电线路多类缺陷目标检测提供参考。展开更多
文摘交通标志在检测过程中,因受天气和光照强度的影响,导致检测时出现错检、漏检等问题,针对此问题提出一种融合空间信息的交通标志检测算法。首先,在网络中使用坐标卷积,增强网络对坐标位置信息的敏锐性。其次,在主干特征提取中加入坐标注意力机制,可以更好地关注融合处的空间位置信息。在特征融合部分使用多尺度加权融合网络和金字塔池化,利用加权计算和跳跃连接的方式,增强低层与高层之间的语义信息融合效果。最后,使用边框回归损失函数(Scalable Intersection over Union Loss,SIoU)提高目标定位的准确性。在CCTSDB2021和GTSDB数据集上的实验结果显示,该方法在2种数据集上的平均精度(mean Average Precision,mAP)分别达到84.9%和98.5%,与主流检测模型对比有显著提升,较原模型分别提升了5.39个百分点和1.67个百分点,提高了交通标志的检测精度。
文摘在交通监控中进行车辆检测过程时,存在车辆互相遮挡和远距离目标尺寸不足的问题,导致在检测中存在漏检和误检情况。针对此问题,文中提出一种基于YOLOv4(You Only Look Once version 4)的多尺度融合与注意力机制的交通车辆检测算法。在YOLOv4的路径聚合网络中增加一个新的特征层进行多尺度特征融合,提升模型对底层纹理特征的提取能力。在YOLO Head检测头前嵌入ECA(Efficient Channel Attention)通道注意力模块,对聚合后的特征进行合理的抑制和增强,将CIoU(Complete Intersection over Union)损失函数替换为Soft-CIoU损失函数,提高小目标车辆对损失函数的贡献度。在公开车辆数据集UA-DETRAC与KITTI中的实验结果表明,相较于原YOLOv4算法,所提算法的平均精度分别提升了2.45百分点和1.14百分点,检测速度达到41.67 frame·s^(-1)。相较于其他先进算法,所提算法在检测精度上表现良好。
文摘针对现有情感分类模型在深层情感理解上的局限性、传统注意力机制的单向性束缚以及自然语言处理(NLP)中的类别不平衡等问题,提出一种融合多尺度BERT(Bidirectional Encoder Representations from Transformers)特征和双向交叉注意力机制的情感分类模型M-BCA(Multi-scale BERT features with Bidirectional Cross Attention)。首先,从BERT的低层、中层和高层分别提取多尺度特征,以捕捉句子文本的表面信息、语法信息和深层语义信息;其次,利用三通道门控循环单元(GRU)进一步提取深层语义特征,从而增强模型对文本的理解能力;最后,为促进不同尺度特征之间的交互与学习,引入双向交叉注意力机制,从而增强多尺度特征之间的相互作用。此外,针对不平衡数据问题,设计数据增强策略,并采用混合损失函数优化模型对少数类别样本的学习。实验结果表明,在细粒度情感分类任务中,M-BCA表现优异。M-BCA在处理分布不平衡的多分类情感数据集时,它的性能显著优于大多数基线模型。此外,M-BCA在少数类别样本的分类任务中表现突出,尤其是在NLPCC 2014与Online_Shopping_10_Cats数据集上,MBCA的少数类别的Macro-Recall领先其他所有对比模型。可见,该模型在细粒度情感分类任务中取得了显著的性能提升,并适用于处理不平衡数据集。
文摘针对在复杂背景下输电线路多尺度缺陷目标检测精度较低的问题,文中提出一种基于改进YOLOv7(You Only Look Once version 7)的输电线路多类缺陷目标检测模型。对于复杂背景造成缺陷目标较低的问题,在Backbone部分引入改进的Swin Transformer模块,通过使用多头注意力机制提升对全局特征的提取效果来提高模型的检测精度。对于待检测目标的多尺度特性,在特征金字塔基础上引入自适应特征融合模块,提升了Neck部分特征融合网络对多类不同尺度缺陷目标的检测能力。使用SIoU(Structured Intersection over Union)损失函数在提高预测框回归精度的同时加快了模型的收敛。实验结果表明,相较于YOLOv5、YOLOv7和Faster R-CNN(Faster Region with Convolutional Neural Network)模型,改进YOLOv7模型具有较高的检测精度,其平均检测精度可达96.4%,检测速度为29.6 frame·s^(-1),能够为输电线路多类缺陷目标检测提供参考。