基于交互图推理网络的弱监督伪装目标检测

Adapting Interactive Graph Inference Networks for Weakly Supervised Camouflaged Object Detection

下载PDF

导出

摘要伪装目标检测(camouflaged object detection,COD)是计算机视觉领域一项具有挑战性的基础研究.由于像素级注释的成本较高,研究者们通常采用涂鸦注释作为弱监督信号.然而,涂鸦标注存在信息过于稀疏且缺乏边缘信息等固有局限,这严重制约了模型的预测可靠性.针对这些问题,本文提出一种新颖的交互图推理网络(interactive graphical reasoning network,IGRNet),该网络通过图表示来推断伪装区域及其边缘之间的内在关系.具体而言,引入了图推理网络建模像素间的长距离依赖关系,设计了高效的图交互单元(graph interaction unit,GIU)增强异构特征的表征能力.同时,为提升模型的场景理解能力并充分利用不同特征间的互补性,构建了上下文增强模块(context enhancement module,CEM)实现多特征融合与上下文信息挖掘.此外,提出了自监督伪装检测损失(self-supervised camouflage detection loss,Lscd)来引导网络学习结构信息,进一步增强前景−背景的区分能力.在3个标准基准数据集上的大量实验表明,本文方法不仅显著优于现有弱监督算法,在某些评估指标上甚至超越了全监督方法的性能. As a challenging fundamental research in computer vision area,camouflaged object detection(COD)usually take scribble annotations as weakly supervised signals due to the high cost of pixel-level annotations.To overcome the inherent limitations of scribble annotations with sparse information and lack of edge information,a novel Interactive Graphical Reasoning Network(IGRNet)was proposed in this paper,inferring the intrinsic relationships between the camouflaged regions and their edges with graph representations to improve the prediction reliability of models.Specifically,a graph inference network was introduced to model long-range dependencies between pixels,and an efficient Graph Interaction Unit(GIU)was designed to enhance the representation of heterogeneous features.Meanwhile,in order to improve the scene understanding ability of the model and make full use of the complementarity between different features,a Context Enhancement Module(CEM)was constructed to achieve multi-feature fusion and contextual information mining.In addition,a self-supervised camouflage detection loss(Lscd)was proposed to guide the network to learn structural information and further improve the foreground-background distinction ability.Extensive experiment results on three standard benchmark datasets show that the proposed method can not only significantly outperform existing weakly-supervised algorithms,but even surpass the performance of fully-supervised methods in some evaluation methods.

作者张冬冬王春平付强宋瑶刘新海 ZHANG Dongdong;WANG Chunping;FU Qiang;SONG Yao;LIU Xinhai(Shijiazhuang Campus,Army Engineering University of PLA,Shijiazhuang,Hebei 050003,China;32368 Army,Beijing 100042,China)

机构地区陆军工程大学石家庄校区 [

出处《北京理工大学学报》北大核心 2025年第7期718-730,共13页 Transactions of Beijing Institute of Technology

基金军内科研项目。

关键词伪装目标检测弱监督涂鸦注释图推理网络上下文信息 camouflaged object detection weak supervision scribble annotation graph inference networks contextual information

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1李向荣,陈永康,王志刚,罗鑫,李晨晓,候湘.一种基于视觉的库区可疑目标识别算法研究[J].北京理工大学学报,2022,42(4):424-429. 被引量：4
2常亮,白傑,黄李波.基于RCBAM和SSD的特征融合低照度环境目标检测算法研究[J].北京理工大学学报,2022,42(3):318-323. 被引量：4

二级参考文献4

1王丽敏,乔玲玲,魏霖静.结合遗传算法的优化卷积神经网络学习方法[J].计算机工程与设计,2017,38(7):1945-1950. 被引量：11
2邢志祥,顾凰琳,钱辉,张莹,汪李金.基于卷积神经网络的行人检测方法研究新进展[J].安全与环境工程,2018,25(6):100-105. 被引量：4
3张继威,牛少彰,曹志义,王心怡.基于深度学习和约束稀疏表达的人脸识别算法[J].北京理工大学学报,2019,39(3):255-261. 被引量：16
4王建中,王洪枫,刘弘扬,李博,孙庸,张驰逸.士兵目标的少样本深度学习检测方法[J].北京理工大学学报,2021,41(6):629-635. 被引量：5

共引文献6

1王晶,莫绪军,朱常玉.基于识别模型泛化能力的目标识别算法简析[J].科学技术创新,2023(21):35-38. 被引量：1
2吴绍斌,耿家琳,吴超,闫泽新,陈恺宇.基于多帧信息的多传感器融合三维目标检测[J].北京理工大学学报,2023,43(12):1282-1289. 被引量：5
3赵增旭,胡连庆,任彬,袁帅.基于激光雷达的PointPillars-S三维目标检测算法[J].光子学报,2025,54(6):10-20. 被引量：2
4田丹,胡元元.基于改进神经网络的汽车雷达影像目标检测研究[J].激光杂志,2025,46(7):168-173.
5赵男男,邓超,温梓呈,陈金舰.基于机器视觉的图像视觉显著目标快速识别算法[J].吉林大学学报(工学版),2025,55(10):3346-3351.
6郭禹伶,刘良帅,陈泽,侯波涛,王颖.面向电力智能巡检系统的图像识别模型鲁棒性研究[J].国外电子测量技术,2025,44(8):76-82.

1丁铖,白雪琼,吕勇,刘洋,牛春晖,刘鑫.基于特征聚合与边缘检测的伪装目标检测[J].光子学报,2024,53(8):260-271. 被引量：2
2阳丽华,梁英,刘仁峰,刘志昂.甲状腺癌与甲状腺肿患者相关实验室指标的比较分析[J].甘肃医药,2025,44(1):53-55.
3何恒兵.尿糖、尿微量白蛋白联合检验应用于糖尿病早期肾损伤诊断中的效果[J].现代消化及介入诊疗,2021(S1):0306-0306.
4龚俊豪,李卫疆.基于三图特征推理的文档级关系抽取[J].中文信息学报,2025,39(5):91-101.
5Ke-Ke Zhang,Meng Li,Yan-Hong Liao,Xiao-Tian Liu,Yong-Bo Bao,Yan Gong.Nintedanib regulates miR-23b-3p/TGFBR2 axis and competitively binds to TGFBR2 protein, inhibiting EMT process in human pterygium cells[J].International Journal of Ophthalmology(English edition),2025,18(5):779-791.
6廖艳,热依拉·吐尔逊,刘冰清,乐娜,高鑫,林殷.补脾养心方对心脾两虚亚健康失眠小鼠睡眠改善的机制[J].中华中医药杂志,2025,40(4):1679-1686.
7张学军,梁书滨,白万荣,张奉鹤,黄海燕,郭梅凤,陈卓.基于异构图表征的源代码漏洞检测方法[J].浙江大学学报(工学版),2025,59(8):1644-1652.
8蒋康,孙仁云,李卓霖,张国灏,刘金庆.改进YOLOv8的轻量化车辆目标检测算法研究[J].重庆理工大学学报(自然科学),2025,39(7):35-42.
9施业成,缪佳李,俞奎.粗细粒度因果关系协同驱动的可解释性视觉问答方法[J].模式识别与人工智能,2025,38(6):552-564.
10范桃,石艳,林椿松,李淇,夏明.基于改进GAS-YOLO的O型密封圈表面缺陷检测算法[J].无线电工程,2025,55(8):1717-1726.

北京理工大学学报

2025年第7期

浏览历史

内容加载中请稍等...

基于交互图推理网络的弱监督伪装目标检测

参考文献2

二级参考文献4

共引文献6

相关作者

相关机构

相关主题

浏览历史