语义引导的红外与可见光图像混合交叉特征融合方法

Semantic-guided Hybrid Cross-feature Fusion Method for Infrared and Visible Light Images

下载PDF

导出

摘要对于自编码器图像融合算法难以突出红外显著目标,现有融合策略难以同时考虑全局结构与局部细节信息,以及大多数融合算法过度关注统计指标,而忽视了高级视觉任务的支持需求的问题,提出了一种基于语义分割网络引导的图像融合方法,并设计了混合交叉特征机制作为融合策略。首先,在编码器和解码器之间引入浅层和深层的跳跃连接,通过最大值选择策略融合特征,以突出显著目标并减少冗余信息。其次,融合策略采用混合交叉特征机制,在单一框架内通过交叉注意力和卷积操作融合不同模态特征,来整合全局上下文与局部细粒度信息。最后,将生成的融合图像输入到分割网络中,利用语义损失引导高级语义信息回流至融合网络,以生成具有丰富语义信息的融合图像。结果表明,所提方法在RoadScene数据集的SD,MI,VIFF,Qabf和AG等客观评价指标上,相较于7种对比算法分别平均提高了33.93%,112.81%,49.89%,27.64%,23.87%。在MSRS数据集的语义分割任务中,该方法在car,person和bicycle这3个类别上交并比超越了7种先进算法,分别平均提高了3.47%,6.37%和9.57%。 To address the difficulty of self-encoder image fusion algorithms in highlighting infrared(IR)salient targets and the challenge of simultaneously considering global structure and local detail information in existing fusion strategies-while most algorithms overly prioritize statistical metrics and overlook support for advanced visual tasks-a semantic segmentation-guided image fusion method with a hybrid cross-feature mechanism is proposed.Shallow and deep skip connections are introduced between the encoder and decoder,employing a maximum value selection strategy to emphasize salient targets and reduce redundancy.The fusion strategy integrates global context and local fine-grained information through cross-attention and convolutional operations,combining different modal features within a single frame.The fused image is then fed into a segmentation network,where semantic loss guides high-level semantic information back to the fusion network,enabling the generation of a fused image rich in semantic detail.Experimental results demonstrate that the proposed method achieves average improvements of 33.93%,112.81%,49.89%,27.64%,and 23.87%in SD,MI,VIFF,Qabf,and AG metrics on the RoadScene dataset compared to seven baseline algorithms.Additionally,the intersection and concurrency ratios for car,person,and bicycle categories in the semantic segmentation task on the MSRS dataset increase by 3.47%,6.37%,and 9.57%on average,outperforming other state-of-the-art methods.

作者季赛乔礼维孙亚杰 JI Sai;QIAO Liwei;SUN Yajie(College of Computer Science,Cyber Science and Engineering,Nanjing University of Information Science and Technology,Nanjing 210044,China;School of Information Engineering,Taizhou University,Taizhou,Jiangsu 225300,China)

机构地区南京信息工程大学计算机学院、网络空间安全学院泰州学院信息工程学院

出处《计算机科学》北大核心 2026年第2期253-263,共11页 Computer Science

基金国家自然科学基金(62172292)。

关键词图像融合红外与可见光图像交叉注意力机制卷积语义分割 Image fusion Infrared and visible image Cross attention mechanism Convolution Semantic segmentation

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1江晟,王鹏朗,邓志吉,别一鸣.基于深度学习的交通事故救援图像融合算法[J].吉林大学学报（工学版）,2023,53(12):3472-3480. 被引量：2
2Jiayi Ma,Linfeng Tang,Fan Fan,Jun Huang,Xiaoguang Mei,Yong Ma.SwinFusion: Cross-domain Long-range Learning for General Image Fusion via Swin Transformer[J].IEEE/CAA Journal of Automatica Sinica,2022,9(7):1200-1217. 被引量：74
3Linfeng Tang,Yuxin Deng,Yong Ma,Jun Huang,Jiayi Ma.SuperFusion: A Versatile Image Registration and Fusion Network with Semantic Awareness[J].IEEE/CAA Journal of Automatica Sinica,2022,9(12):2121-2137. 被引量：14

二级参考文献13

1殷明,庞纪勇,魏远远,段普宏.结合NSDTCT和压缩感知PCNN的图像融合算法[J].计算机辅助设计与图形学学报,2016,28(3):411-419. 被引量：14
2顾振飞,袁小燕,张登银,孔令民,李想.一种基于区域显著性识别的红外图像增强方法[J].江苏大学学报（自然科学版）,2019,40(6):681-687. 被引量：17
3王彬,赵作鹏.基于双流全卷积网络的驾驶员姿态估计方法[J].江苏大学学报（自然科学版）,2022,43(2):161-168. 被引量：5
4圣文顺,孙艳文,张会影.基于稀疏理论与FFST-GIF的多聚焦图像融合算法[J].江苏大学学报（自然科学版）,2022,43(2):195-200. 被引量：9
5苏宁,叶晗鸣,王逍遥.基于Adam优化的多传感器对接位姿融合算法研究[J].现代制造技术与装备,2022,58(2):35-37. 被引量：1
6Jiayi Ma,Linfeng Tang,Fan Fan,Jun Huang,Xiaoguang Mei,Yong Ma.SwinFusion: Cross-domain Long-range Learning for General Image Fusion via Swin Transformer[J].IEEE/CAA Journal of Automatica Sinica,2022,9(7):1200-1217. 被引量：74
7Yu Liu,Yu Shi,Fuhao Mu,Juan Cheng,Xun Chen.Glioma Segmentation-Oriented Multi-Modal MR Image Fusion With Adversarial Learning[J].IEEE/CAA Journal of Automatica Sinica,2022,9(8):1528-1531. 被引量：3
8申铉京,张雪峰,王玉,金玉波.像素级卷积神经网络多聚焦图像融合算法[J].吉林大学学报（工学版）,2022,52(8):1857-1864. 被引量：11
9李臣旭,江浩斌,王成雨,马世典.基于传感器信息融合的车辆位姿估算方法[J].江苏大学学报（自然科学版）,2022,43(6):636-644. 被引量：16
10张威.生成式双波段彩色融合图像质量评价[J].电子设计工程,2023,31(5):1-6. 被引量：2

共引文献80

1陈凡,宋文革,范誉瀚,陈塞.基于CNN-Transformer融合模型的选煤厂振动筛上杂物语义分割研究[J].煤炭工程,2023,55(S01):193-199. 被引量：2
2Linfeng Tang,Yuxin Deng,Yong Ma,Jun Huang,Jiayi Ma.SuperFusion: A Versatile Image Registration and Fusion Network with Semantic Awareness[J].IEEE/CAA Journal of Automatica Sinica,2022,9(12):2121-2137. 被引量：14
3Quan Kong,Huabing Zhou,Yuntao Wu.NormFuse: Infrared and Visible Image Fusion With Pixel-Adaptive Normalization[J].IEEE/CAA Journal of Automatica Sinica,2022,9(12):2190-2192. 被引量：1
4贺鹏飞,马建飞,李成林,张桐敬,粱大伟.基于Swin Transformer的疟疾细胞图像识别研究[J].中国医学物理学杂志,2023,40(8):996-1001.
5刘文清,王任华,刘晓文,杨馨.基于显著目标提取和泊松重建的红外与可见光图像融合方法[J].激光与光电子学进展,2023,60(16):175-184. 被引量：7
6Yuanyuan Wu,Yuchun Li,Mengxing Huang,Siling Feng.Multiresolution generative adversarial networks with bidirectional adaptive-stage progressive guided fusion for remote sensing image[J].International Journal of Digital Earth,2023,16(1):2962-2997.
7邬开俊,梅源.细粒度全局感知多聚焦图像融合网络[J].湖南大学学报（自然科学版）,2023,50(12):10-18.
8陈伟,孙康康,李奇轩,谢凯,倪昕晔.多模态医学图像融合方法的研究进展[J].中国辐射卫生,2023,32(5):580-585. 被引量：7
9Yifan Lu,Jiayi Ma,Xiaoguang Mei,Jun Huang,Xiao-Ping Zhang.Feature Matching via Topology-Aware Graph Interaction Model[J].IEEE/CAA Journal of Automatica Sinica,2024,11(1):113-130.
10Yanan Jia,Qiming Hu,Renwei Dian,Jiayi Ma,Xiaojie Guo.PAPS: Progressive Attention-Based Pan-sharpening[J].IEEE/CAA Journal of Automatica Sinica,2024,11(2):391-404. 被引量：1

1郭津延,郑红,杜佳宇,罗俞建,李鹏威,单蓉胜.基于双尺度自适应令牌注意力的交通流量预测[J].华东理工大学学报(自然科学版),2025,51(6):817-826.
2程粟.低秩微调模型与神经网络引导下的AI辅助室内设计实验研究[J].家具与室内装饰,2025,32(11):19-25. 被引量：1
3杨青霞,潘登,黄万林,陈尔康,黄斌.基于CAO的海域监控场景红外与可见光图像配准[J].集美大学学报(自然科学版),2026,31(1):67-76.
4高绍姝,焦广森,李广峰,刘宗恩.改进U-Net的全局特征融合水下图像增强网络[J].光学精密工程,2026,34(2):322-335.
5封筠,刘娜,霍一儒,李家龙,杨靖祎.适配SAM2特征融合的内窥镜结肠息肉图像分割[J].华中科技大学学报(自然科学版),2025,53(12):163-170.
6张卓,冯小溪.人文医学专业教师数字素养提升策略[J].锦州医科大学学报(社会科学版),2026,24(1):73-76.
7李瑞,张贤宇,尤尹,汪骥,张全有.基于多特征融合的集装箱船导轨缺陷检测算法[J].大连理工大学学报,2026,66(1):86-93.
8彭高川.2014—2025年中国数字鸿沟研究的热点与趋势——基于CiteSpace的可视化分析[J].乡村科技,2025,16(22):11-18.
9张焰,伍浩松.英拟从堆后铀中提取医用同位素铅-212[J].国外核新闻,2026(1):28-28.
10欧阳荣.近十年来电影叙事动态与趋势研究——基于CiteSpace的CNKI文献可视化分析[J].统计学与应用,2026,15(1):197-206.

计算机科学

2026年第2期

浏览历史

内容加载中请稍等...

语义引导的红外与可见光图像混合交叉特征融合方法

参考文献3

二级参考文献13

共引文献80

相关作者

相关机构

相关主题

浏览历史