期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于跨模态Mamba交互融合网络的RGBT目标跟踪
1
作者 周姣 《电脑编程技巧与维护》 2026年第3期174-176,共3页
RGBT目标跟踪借助可见光-热红外双模态互补信息可提升复杂环境下的跟踪鲁棒性,但现有方法存在模态动态关系建模不足、跨模态长距离依赖捕捉低效及全参数微调资源消耗大等问题。提出了跨模态Mamba交互融合网络用于RGBT目标跟踪。该方法... RGBT目标跟踪借助可见光-热红外双模态互补信息可提升复杂环境下的跟踪鲁棒性,但现有方法存在模态动态关系建模不足、跨模态长距离依赖捕捉低效及全参数微调资源消耗大等问题。提出了跨模态Mamba交互融合网络用于RGBT目标跟踪。该方法采用共享参数主干网络提取RGB与TIR特征,在特定层引入跨模态Mamba交互融合模块(CMMIF),通过两阶段处理实现高效跨模态融合以发挥模态互补性。训练时冻结主干参数仅更新Mamba模块参数,大幅降低资源消耗。实验结果显示,该方法在RGBT234和LasHeR数据集上表现优异,且推理速度突出,验证了其精度与效率优势,为RGBT跨模态跟踪提供了高效动态融合方案,提升了复杂场景下的跟踪可靠性。 展开更多
关键词 rgbt目标跟踪 跨模态融合 Mamba网络 跨模态Mamba交互融合模块
在线阅读 下载PDF
SiamMT:基于自适应特征融合机制的可修正RGBT目标跟踪算法 被引量:2
2
作者 齐咏生 姜政廷 +2 位作者 刘利强 苏建强 张丽杰 《控制与决策》 北大核心 2025年第4期1312-1320,共9页
针对传统RGBT目标跟踪算法网络精确度低、鲁棒性差,以及在目标尺度变化大和长时跟踪过程中存在目标丢失无法找回等问题,提出一种新的基于自适应特征融合机制的可修正RGBT目标跟踪算法.首先,引入一种特征层与模态间双自适应融合机制,充... 针对传统RGBT目标跟踪算法网络精确度低、鲁棒性差,以及在目标尺度变化大和长时跟踪过程中存在目标丢失无法找回等问题,提出一种新的基于自适应特征融合机制的可修正RGBT目标跟踪算法.首先,引入一种特征层与模态间双自适应融合机制,充分利用两模态间的互补信息,增强RGB与红外特征的跨模态融合;然后,设计一种后端时序约束回归模块,利用上一帧信息对IOU计算以及边界框回归进行约束,有效减少相似物干扰;最后,提出一种基于元学习的在线模板更新机制,对回归阶段得分较高的模板图像进行更新存储,解决长时跟踪中累计误差和目标难以找回问题.采用权威的目标跟踪数据集GTOT、RGBT234和VOT-RGBT2019进行算法验证,所提出方法均可取得极具竞争力的结果.将算法移植到嵌入式设备Jetson Xavier NX上进行性能测试,实验结果表明:所提出算法运行速度可达到29帧/s,相比于当前流行的多种RGBT算法,具有更为全面的跟踪性能,且能够有效解决相似物干扰、目标丢失难找回等问题. 展开更多
关键词 目标跟踪 孪生网络 rgbt 元学习 特征融合
原文传递
基于多模态特征对齐的弱对齐RGBT显著目标检测 被引量:1
3
作者 刘成壮 翟素兰 +1 位作者 刘海庆 王鲲鹏 《计算机科学》 北大核心 2025年第7期142-150,共9页
可见光和热红外(RGBT)显著目标检测(SOD)旨在从可见光和热红外图像中识别共同的显著物体。然而,现有技术大多在完全对齐的图像对上进行训练,忽略了实际成像过程中由传感器差异造成的“弱对齐”问题,即同一物体在不同模态中虽然结构相关... 可见光和热红外(RGBT)显著目标检测(SOD)旨在从可见光和热红外图像中识别共同的显著物体。然而,现有技术大多在完全对齐的图像对上进行训练,忽略了实际成像过程中由传感器差异造成的“弱对齐”问题,即同一物体在不同模态中虽然结构相关,但是它们的位置、尺度存在差异。因此,如果不经对齐处理,直接使用弱对齐RGBT图像训练模型,会导致检测性能严重下降。为应对这一挑战,提出了一个多模态特征对齐融合网络(AFNet),专门针对弱对齐RGBT SOD。该网络由3个主要模块组成:分布对齐模块(DAM)、注意力引导的可变形卷积对齐模块(AGDCM)和交叉融合模块(CAM)。DAM基于最优传输理论,使热红外和RGB特征的分布尽可能接近,实现特征的初步对齐。AGDCM基于可变形卷积,在学习特征偏移量的过程中引入注意力权重,使不同的区域可以学习到适合自身的偏移量,实现多模态特征的精准对齐。CAM通过交叉注意力机制融合对齐后的特征,增强融合特征的判别能力并提高计算效率。通过在对齐和弱对齐数据集上进行大量实验,证明了所提方法的高效性。 展开更多
关键词 弱对齐rgbt图像 显著目标检测 多模态特征对齐 多模态特征融合 注意力机制
在线阅读 下载PDF
面向不同挑战及同异质信息分离的RGBT跟踪
4
作者 方鑫 陈柘 +2 位作者 刘占文 李小鹏 宿雨心 《电子学报》 北大核心 2025年第3期910-925,共16页
可见光热红外(RGB and Thermal infrared,RGBT)跟踪是一种结合了可见光和热红外光两种不同传感器信息的多模态目标跟踪方法 .这种方法旨在克服单一传感器在特定环境下的局限性,通过融合多种传感器的数据来提高目标跟踪的鲁棒性和准确性... 可见光热红外(RGB and Thermal infrared,RGBT)跟踪是一种结合了可见光和热红外光两种不同传感器信息的多模态目标跟踪方法 .这种方法旨在克服单一传感器在特定环境下的局限性,通过融合多种传感器的数据来提高目标跟踪的鲁棒性和准确性.然而,在现有的RGBT跟踪算法中,大多将可见光与热红外图像提取的特征直接进行融合,忽略了两种模态间的同质性与异质性.此外,RGBT跟踪还经常受到目标快速运动、尺度变化、光照变化、热交叉和遮挡等多种挑战因素的影响,现有工作往往是通过研究单一结构来同时解决所有问题,但这需要足够复杂的模型和足够多的训练数据.本文提出了一种新的面向不同挑战并结合多模态同异质信息分离与融合的网络,用于RGBT跟踪.在该网络的每层主干中都设计了一个挑战感知模块用于融合每种挑战下来自可见光与热红外两种不同模态的特征,并自适应地聚合所有挑战下的融合特征.此外,还加入了注意力增强模块及多尺度辅助模块对主干网络所提取的特征进行增强.最后根据可见光与热红外的同质性与异质性,分别提取它们的特有特征与共有特征并进行自适应融合.在GTOT、RGBT234和LasHeR数据集上的大量实验表明,与现有RGBT跟踪方法相比,本文提出的跟踪器显示出非常强的竞争力. 展开更多
关键词 rgbt跟踪 挑战感知 同异质信息分离 自适应聚合 注意力机制 多尺度特征
在线阅读 下载PDF
引入Transformer的RGBT自适应融合视觉跟踪
5
作者 郭勇 谌海云 +1 位作者 陈建宇 肖章勇 《红外技术》 北大核心 2025年第8期998-1008,共11页
RGBT目标跟踪利用可见光和热红外两种模态信息的互补性改善了在云雾遮挡、光照变化等场景下的跟踪性能,但由于可见光和热红外图像特征差异较大,导致大多数跟踪算法特征信息提取不充分、特征融合的冗余信息太多。针对以上问题,提出一种引... RGBT目标跟踪利用可见光和热红外两种模态信息的互补性改善了在云雾遮挡、光照变化等场景下的跟踪性能,但由于可见光和热红外图像特征差异较大,导致大多数跟踪算法特征信息提取不充分、特征融合的冗余信息太多。针对以上问题,提出一种引入Transformer的RGBT自适应融合目标跟踪算法SiamTAF。首先,在特征提取阶段,使用Transformer分别对可见光和热红外分支的AlexNet网络后两层进行改进,使其具有建立特征上下文依赖性的能力。其次,结合交叉注意力和挑选机制提出一种自适应融合模块,以促进两模态特征的互补性融合。最后,为了让线性互相关运算具有捕捉非线性相似特征的能力,在线性互相关运算中加入非线性门控注意力。在GTOT和RGBT234基准数据集上的实验结果表明,相比MANet、DAFNet、DAPNet等算法,SiamTAF算法在面对热交叉、光照变化等问题时,其跟踪性能更具鲁棒性。 展开更多
关键词 rgbt TRANSFORMER 自适应融合 互相关运算 门控注意力
在线阅读 下载PDF
动态模态交互和特征自适应融合的RGBT跟踪 被引量:4
6
作者 王福田 张淑云 +1 位作者 李成龙 罗斌 《中国图象图形学报》 CSCD 北大核心 2022年第10期3010-3021,共12页
目的可见光和热红外模态数据具有很强的互补性,RGBT(RGB-thermal)跟踪受到越来越多的关注。传统RGBT目标跟踪方法只是将两个模态的特征进行简单融合,跟踪的性能受到一定程度的限制。本文提出了一种基于动态交互和融合的方法,协作学习面... 目的可见光和热红外模态数据具有很强的互补性,RGBT(RGB-thermal)跟踪受到越来越多的关注。传统RGBT目标跟踪方法只是将两个模态的特征进行简单融合,跟踪的性能受到一定程度的限制。本文提出了一种基于动态交互和融合的方法,协作学习面向RGBT跟踪的模态特定和互补表示。方法首先,不同模态的特征进行交互生成多模态特征,在每个模态的特定特征学习中使用注意力机制来提升判别性。其次,通过融合不同层次的多模态特征来获得丰富的空间和语义信息,并通过设计一个互补特征学习模块来进行不同模态互补特征的学习。最后,提出一个动态权重损失函数,根据对两个模态特定分支预测结果的一致性和不确定性进行约束以自适应优化整个网络中的参数。结果在两个基准RGBT目标跟踪数据集上进行实验,数据表明,在RGBT234数据集上,本文方法的精确率(precision rate,PR)为79.2%,成功率(success rate,SR)为55.8%;在GTOT(grayscale-thermal object tracking)数据集上,本文方法的精确率为86.1%,成功率为70.9%。同时也在RGBT234和GTOT数据集上进行了对比实验以验证算法的有效性,实验结果表明本文方法改善了RGBT目标跟踪的结果。结论本文提出的RGBT目标跟踪算法,有效挖掘了两个模态之间的互补性,取得了较好的跟踪精度。 展开更多
关键词 模态交互 模态融合 互补特征学习 模态特定信息 rgbt目标跟踪
原文传递
用于RGBT跟踪的孪生混合信息融合算法 被引量:1
7
作者 黄颖 杨佳宇 +1 位作者 金家昊 万邦睿 《计算机应用》 CSCD 北大核心 2024年第9期2878-2885,共8页
可见光与热红外跟踪(又称RGBT(RGB-Thermal)跟踪)的核心是有效地利用不同模态的信息,针对决策级融合中单分支产生低质结果影响算法判定目标的问题,提出一个用于RGBT跟踪的孪生混合信息融合算法SiamMIF。首先,使用孪生主干网络(SBN)进行... 可见光与热红外跟踪(又称RGBT(RGB-Thermal)跟踪)的核心是有效地利用不同模态的信息,针对决策级融合中单分支产生低质结果影响算法判定目标的问题,提出一个用于RGBT跟踪的孪生混合信息融合算法SiamMIF。首先,使用孪生主干网络(SBN)进行多模态特征提取;其次,从信噪比的角度分析低质图像对双分支并行决策产生的影响,进而设计了一个信噪比驱动的信息交互模块(IIM)对低信噪比特征进行信息互补;再次,利用双流无锚跟踪头(ADH)对补偿后的特征进行分类回归;最后,采用自适应轻量决策模块(ALDM)对跟踪结果进行融合,并快速判定目标位置。在4个RGBT基准数据集GTOT、RGBT234、VOT-RGBT2019和LasHeR上的实验结果表明,所提算法在LasHeR数据集上的成功率和精确度分别为0.396和0.518,相较于APFNet(Attribute-based Progressive Fusion Network)提升9.4%和3.6%,在其他3个数据集上也能取得较好结果,且在GPU上的帧率能达到40 frame/s。 展开更多
关键词 rgbt跟踪 孪生神经网络 多模态融合策略 信息交互 无锚跟踪头
在线阅读 下载PDF
一种时域模板更新的RGBT渐进融合视觉跟踪 被引量:1
8
作者 郭勇 谌海云 +1 位作者 陈建宇 袁杰敏 《红外与激光工程》 EI CSCD 北大核心 2024年第11期279-293,共15页
由于大多数RGBT跟踪算法的特征提取、融合、匹配方式简单,导致在面临形变、遮挡和低分辨率等问题时跟踪目标丢失。针对以上问题,提出一种时域模板更新的RGBT渐进融合目标跟踪算法SiamDPF。首先,在特征提取阶段,使用空洞卷积与Transforme... 由于大多数RGBT跟踪算法的特征提取、融合、匹配方式简单,导致在面临形变、遮挡和低分辨率等问题时跟踪目标丢失。针对以上问题,提出一种时域模板更新的RGBT渐进融合目标跟踪算法SiamDPF。首先,在特征提取阶段,使用空洞卷积与Transformer对两模态的AlexNet网络后两层进行改进,以增强其低分辨率目标的特征表示能力。其次,结合交叉注意力和门控机制提出一种渐进融合模块,对两模态的浅层与深层特征进行渐进交互融合,使模态信息融合更充分。最后,为了让跟踪器能够利用时域上下文信息来改善形变目标的跟踪问题,使用交叉注意力让上一帧目标特征与在线模板特征进行交互更新。在GTOT和RGBT234基准数据集上的实验结果表明,SiamDPF算法在面对目标形变、遮挡、低分辨率等问题时,与其他算法相比其跟踪性能更具鲁棒性。 展开更多
关键词 rgbt跟踪 空洞卷积 TRANSFORMER 交叉注意力 门控机制
原文传递
基于高秩特征和位置注意力的RGBT目标跟踪 被引量:1
9
作者 杨岚岚 王文琪 王福田 《计算机科学》 CSCD 北大核心 2022年第12期236-243,共8页
RGBT目标跟踪利用可见光(RGB)与热红外(T)两种不同模态的优势来解决单一模态目标跟踪中常见的模态受限问题,以此提升复杂环境下的目标跟踪性能。在RGBT目标跟踪算法中,精准定位目标位置和有效融合两种模态都是非常重要的问题。为了达到... RGBT目标跟踪利用可见光(RGB)与热红外(T)两种不同模态的优势来解决单一模态目标跟踪中常见的模态受限问题,以此提升复杂环境下的目标跟踪性能。在RGBT目标跟踪算法中,精准定位目标位置和有效融合两种模态都是非常重要的问题。为了达到精准定位目标以及有效融合两种模态的目的,提出了一种探索高秩的特征图以及引入位置注意力来进行RGBT目标跟踪的新方法。该方法首先根据主干网络的深层与浅层的特征,使用位置注意力来关注目标的位置信息,接着通过探索两种模态融合前的高秩特征图,关注特征的重要性,以指导模态特征融合。为了关注目标位置信息,在行和列上使用平均池化操作。对于高秩特征指导模块,文中根据特征图的秩来指导特征图的融合。并且,为了去除冗余和噪声,实现更加鲁棒的特征表达,直接删除了秩小的特征图。在两个RGBT跟踪基准数据集上的实验结果表明,与其他RGBT目标跟踪方法相比,所提方法在准确度和成功率上取得了更好的跟踪结果。 展开更多
关键词 rgbt目标跟踪 高秩特征图 目标位置信息
在线阅读 下载PDF
RGBT多模态视觉跟踪方法综述 被引量:2
10
作者 杨晓丽 张馨月 +2 位作者 于涛 高鹏 王茂励 《计算机测量与控制》 2024年第9期1-8,35,共9页
RGBT视觉跟踪是指融合可见光和热红外多模态图像信息进行视觉跟踪的新兴热点研究课题,合理融合可见光和热红外图像的互补信息可以提高跟踪器的性能和鲁棒性;人工智能技术的发展推动了RGBT多模态视觉跟踪的发展,深度学习技术逐渐代替传... RGBT视觉跟踪是指融合可见光和热红外多模态图像信息进行视觉跟踪的新兴热点研究课题,合理融合可见光和热红外图像的互补信息可以提高跟踪器的性能和鲁棒性;人工智能技术的发展推动了RGBT多模态视觉跟踪的发展,深度学习技术逐渐代替传统目标跟踪方法,在精确度与速度方面更具有优势;对近年来RGBT多模态视觉跟踪进行了全面综述,整理了RGBT多模态视觉跟踪的发展历程,归纳和讨论了相关算法,具体包括基于相关滤波的方法和基于深度学习的方法;回顾了RGBT多模态视觉跟踪数据集的发展历史,介绍了算法性能评估指标,分析了不同方法在评估数据集上的性能,展望了RGBT多模态视觉跟踪的未来研究趋势;旨在为相关研究者提供全面的概览和参考,以促进RGBT多模态视觉跟踪领域的研究和发展。 展开更多
关键词 计算机视觉 rgbt视觉跟踪 信息融合 相关滤波 深度学习
在线阅读 下载PDF
基于多层注意力机制的RGBT目标跟踪
11
作者 吴毅 翟素兰 刘磊 《安庆师范大学学报(自然科学版)》 2024年第2期77-83,共7页
挖掘热红外和可见光数据的互补信息,可以有效提升复杂环境下视觉跟踪的鲁棒性。然而大多数方法在特征提取过程中只是独立提取单模态特征,忽略了多层特征建模对准确定位目标位置的重要作用。针对上述问题,本文提出了基于多层注意力机制的... 挖掘热红外和可见光数据的互补信息,可以有效提升复杂环境下视觉跟踪的鲁棒性。然而大多数方法在特征提取过程中只是独立提取单模态特征,忽略了多层特征建模对准确定位目标位置的重要作用。针对上述问题,本文提出了基于多层注意力机制的RGBT目标跟踪方法。首先,将多模态图片对输入骨干网络以提取两种模态的深度特征,同时在各层特征提取中引入模态注意力模块,用于过滤不准确的多模态信息,有效实现多层次多模态特征建模。此外,为了抑制多模态融合特征中的噪声和冗余信息,本文提出了模态融合模块,并利用该模块进一步实现多模态特征的自适应融合,从而获得更具有判别性的多模态特征。在两个公开数据集上的实验表明,本文方法在RGBT目标跟踪任务上实现了高精度和快速跟踪。 展开更多
关键词 rgbt目标跟踪 特征建模 注意力机制 多模态融合特征 自适应融合
在线阅读 下载PDF
非对称的分层特征融合的RGBT跟踪网络
12
作者 吴习惠 李婷 葛洪伟 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第11期1700-1709,共10页
为了解决可见光图像和热红外图像由于成像原理不同而导致的模态存在异质性的问题,提出一种非对称的分层特征融合的RGBT跟踪网络.首先通过双流网络分别提取可见光和热红外的特征;然后通过模态特征提取模块挖掘不同模态特征,并对获得的特... 为了解决可见光图像和热红外图像由于成像原理不同而导致的模态存在异质性的问题,提出一种非对称的分层特征融合的RGBT跟踪网络.首先通过双流网络分别提取可见光和热红外的特征;然后通过模态特征提取模块挖掘不同模态特征,并对获得的特征进行自适应聚合,以获得有利于增强可见光模态的特征;最后将各层获得的聚合特征与双流网络获得的可见光特征进行增强融合,获得更具有鲁棒性的特征.在GTOT, RGBT234和LasHeR数据集上的实验结果表明,所提网络的跟踪精度(PR)和成功率(SR)分别达到92.2%/77.2%,82.9%/61.1%和52.7%/40.3%,与目前主流的RGBT目标跟踪网络相比, PR和SR均有所提高,验证了该网络的有效性. 展开更多
关键词 非对称结构 分层特征融合 rgbt目标跟踪 TRANSFORMER
在线阅读 下载PDF
基于交叉自注意机制的RGBT目标跟踪方法
13
作者 王宇斌 程瑚 《江苏通信》 2024年第6期64-69,共6页
论文针对传统基于卷积神经网络目标跟踪无法有效利用上下文信息融合多模态注意力的问题,提出基于双分支交叉自注意力机制的RGBT(RGB-Thermal,红外可见光联合)目标跟踪方法。所提模型引入基于双分支Transformer模块分别编码红外及可见光... 论文针对传统基于卷积神经网络目标跟踪无法有效利用上下文信息融合多模态注意力的问题,提出基于双分支交叉自注意力机制的RGBT(RGB-Thermal,红外可见光联合)目标跟踪方法。所提模型引入基于双分支Transformer模块分别编码红外及可见光目标,在双分支并行编码基础上利用交叉注意力机制将两个分支的注意力进行对齐,从而提高了目标跟踪的准确性和稳定性。通过三个数据集的大量实验可验证所提方法的优越性。 展开更多
关键词 rgbt目标跟踪 TRANSFORMER 交叉注意力
在线阅读 下载PDF
多尺度选择注意力的双模态目标追踪算法 被引量:1
14
作者 晏开祥 周冬明 +1 位作者 王长城 周子为 《无线电工程》 北大核心 2023年第10期2261-2269,共9页
与可见光相比,红外光在部分复杂环境下仍能保持追踪目标的图像捕捉能力。因此,红外光图像可帮助计算机视觉跟踪算法提高目标跟踪的精度和鲁棒性。但在真实的目标追踪序列场景中,跟踪画面还存在眩光、形变和镜头抖动等干扰。为抵御此类干... 与可见光相比,红外光在部分复杂环境下仍能保持追踪目标的图像捕捉能力。因此,红外光图像可帮助计算机视觉跟踪算法提高目标跟踪的精度和鲁棒性。但在真实的目标追踪序列场景中,跟踪画面还存在眩光、形变和镜头抖动等干扰。为抵御此类干扰,提出了一种使用多尺度选择注意力的红外可见光融合目标跟踪算法(Selective Kernel Attention Fusion Tracking Network,SKANet)。该算法利用多尺度卷积核以及通道选择注意力,提取不同尺度大小的目标特征并将模型权重聚焦于质量较高的特征图、降低干扰带来的不利影响,从而提高模型的跟踪性能。通过在RGBT234和GTOT数据集上的验证结果表明,该算法可有效抵抗画面中干扰情况带来的不利影响,实现高精度的目标追踪。 展开更多
关键词 rgbt目标跟踪 多尺度卷积 通道注意力 自适应特征融合
在线阅读 下载PDF
可见光与红外融合目标跟踪技术研究进展综述
15
作者 方彦策 赵君灵 +4 位作者 黄昭龙 李旗挺 杜立超 张宏江 宋眉眉 《计算机测量与控制》 2022年第10期7-16,共10页
目标跟踪是计算机视觉领域中的一个重要的问题,自从被提出以来逐渐发展出了不同类型的技术方法;由于可见光与红外光在目标跟踪方面存在互补性,两者融合的目标跟踪技术在性能和鲁棒性上比传统目标跟踪方法更具有优势;近年来,人工智能技... 目标跟踪是计算机视觉领域中的一个重要的问题,自从被提出以来逐渐发展出了不同类型的技术方法;由于可见光与红外光在目标跟踪方面存在互补性,两者融合的目标跟踪技术在性能和鲁棒性上比传统目标跟踪方法更具有优势;近年来,人工智能技术的发展推动了可见光与红外融合目标跟踪技术的快速进步;面向可见光与红外融合目标跟踪技术的发展历程,首先针对可见光与红外融合领域经典方法和近年来出现的技术进行梳理和总结,特别是对近两年的研究进展进行了归纳整理,具体包括基于Transformer、基于注意力机制、基于时间序列、自适应融合和基于多模态编解码器的可见光与红外融合目标跟踪方法;然后介绍了可见光与红外融合数据集及目标跟踪的评价指标;最后对未来的发展方向作了展望。 展开更多
关键词 目标跟踪 可见光与红外融合(rgbt) 深度学习 TRANSFORMER 注意力机制
在线阅读 下载PDF
多层次特征交互的双模态目标追踪算法
16
作者 刘宜松 周冬明 晏开祥 《无线电工程》 2024年第9期2162-2172,共11页
红外与可见光(RGB and Thermal,RGBT)目标跟踪得益于可见光与热红外2种模态数据的互补优势能够很好地提升跟踪器在部分极端环境下的目标定位能力。现有工作主要集中于如何对2种模态的特征进行提取和融合,忽略了不同模态中分层深度特征... 红外与可见光(RGB and Thermal,RGBT)目标跟踪得益于可见光与热红外2种模态数据的互补优势能够很好地提升跟踪器在部分极端环境下的目标定位能力。现有工作主要集中于如何对2种模态的特征进行提取和融合,忽略了不同模态中分层深度特征的潜在价值,这些分层深度特征对目标的定位与分类有着重要的作用。为此,提出了一种多层次特征交互的多模态自适应融合目标跟踪算法(Multi-layer Feature Interaction and Modal-adaptation Fusion Network,MIMFNet),通过特征提取器和注意力机制对分层特征进行提取与自适应校准;分层特征聚合子网将不同层的特征进行自上而下相互聚合,使低层特征不仅保留了自身的空间细节也获取了高层特征的语义信息。设计了一种多模态信息传递模块对2种模态的分层信息进行自适应融合,使模型聚焦到质量更高的特征通道上。通过多个公开数据集上的大量实验结果表明,提出的多模态目标跟踪算法具有优良的抗干扰特性,特别是由于尺度变化(Scale Variation,SV)、热交叉(Thermal Crossover,TC)和遮挡(Occlusion,OCC)等因素引起的跟踪漂移得到了显著优化。 展开更多
关键词 红外与可见光目标跟踪 自适应融合 特征聚合 通道注意力
在线阅读 下载PDF
DBDB:de-bimodal defocus blur in joint infrared-visible imaging
17
作者 Zhe Cao Lixin Xu +3 位作者 Jin Zhang Biwen Yang Kaizheng Chen Ruiheng Zhang 《Visual Intelligence》 2025年第1期86-97,共12页
Despite the recent accomplishments in joint infrared-visible imaging,the bimodal defocus blur(BDB)phenomenon received scant attention.Our analysis reveals that BDB is predominantly attributable to disparities in optic... Despite the recent accomplishments in joint infrared-visible imaging,the bimodal defocus blur(BDB)phenomenon received scant attention.Our analysis reveals that BDB is predominantly attributable to disparities in optical parameters between cameras,resulting in two primary challenges:incomplete single-modal information and difficulty in cross-modal information interaction.With regard to the former,the infrared modality is the primary victim,as the deblurring networks’bias toward high-frequency results in erroneous low-frequency reconstruction(e.g.,over-sharpening).In the latter case,the relative nature of the blur effect can lead to ambiguity in determining which modality’s information should be prioritized for guidance,and conflicts may arise between the clear components of the blurred image and the blurry components of the clear image.To address these issues,we propose the first de-bimodal defocus blur(DBDB)method,which consists of a low-frequency semantic hold(LSH)module with a pre-trained infrared model and a cross-modal complementary feature induction(CCFI)module driven by a max-min blur entropy loss.LSH is designed to ensure that the low-frequency information captured by the infrared modality does not contain any misleading data,while CCFI facilitates the acquisition of accurate information by means of adaptive adjustment and the loss function.The experimental results of deblurring and downstream tasks on two synthetic datasets demonstrate the superiority of our method. 展开更多
关键词 Image reconstruction rgbt Defocus blur Multimodal learning Pre-training model
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部