基于伪标签去噪和SAM优化的大规模无监督语义分割

Pseudo-label Denoising and SAM Optimization for Large-scale Unsupervised Semantic Segmentation

下载PDF

导出

摘要语义分割技术能够对复杂、多元的场景实现细粒度理解,是促进无人系统高效、智能工作的关键技术之一.大规模无监督语义分割旨在从大规模未标记图像中学习语义分割能力.然而,现有方法由于自学习伪标签存在类别混淆和形状表示欠佳的问题,导致最终分割精度较低.为此,本文提出一种伪标签去噪和SAM优化(Pseudo-label Denoising and SAM Optimization,PDSO)方法以解决大规模无监督语义分割问题.本文设计了一种基于去噪的特征微调模块,在基于小损失准则从大规模数据集中筛选出具有干净图像级伪标签的潜在样本后,利用这些干净样本对预训练的主干网络进行微调,使网络获得更稳健的类别表示.为了进一步减少伪标签中的类别噪声,设计了一种基于聚类的样本去噪模块,根据类别占比和样本与聚类中心之间的距离来去除干扰聚类任务的噪声样本,从而提升聚类性能.本文还设计了一种SAM提示优化模块,根据聚类距离识别出图像中的活跃类别,以过滤噪声目标,并将点和框作为SAM的目标提示信息,生成预期的目标掩膜以细化伪标签中目标的边缘.实验结果表明,在大规模语义分割数据集ImageNet-S_(50)、ImageNet-S_(300)和ImageNet-S_(919)的测试集上,本文方法在平均交并比指标上分别达到了45.0%、26.6%和14.5%,显著提高了分割目标的类别准确率和边缘精度. Semantic segmentation technology enables fine-grained understanding of complex and diverse scenes and is one of the key technologies to promote efficient and intelligent work of unmanned systems.Large-scale unsupervised semantic segmentation aims to learn semantic segmentation capabilities from a large number of unlabeled images.However,the existing approaches suffer heavily from their noisy self-learned pseudo-labels with poor category and shape representations,leading to low final segmentation accuracy.In this paper,we propose a Pseudo-label Denoising and SAM Optimization(PDSO)approach for large-scale unsupervised semantic segmentation to alleviate the problem mentioned above.Specifically,we first propose a denoising-based feature fine-tuning module,which fine-tunes the pre-trained backbone network with clean image-level pseudo-label samples selected from a large dataset based on a small loss criterion,enabling the network to obtain more robust category representations.To further reduce category noise in pseudo-labels,we propose a clustering-based sample denoising module to discard noisy samples that interfere with clustering based on the category proportion and the distances between samples and cluster centers,thereby enhancing clustering performance.Moreover,we propose a SAM prompt optimization module,which identifies active categories in the image based on clustering distance to filter out noisy targets and uses points and boxes as SAM’s target prompt information to generate expected target masks and refine the edges of targets in pseudo-labels.Our proposed PDSO reaches the mIoU of 45.0%,26.6%,and 14.5%on the test set of ImageNet-S_(50),ImageNet-S_(300),and ImageNet-S_(919)datasets,respectively,which significantly improves the category accuracy and edge accuracy of the segmented targets.

作者杨维静徐瑞顾浩文陈涛舒祥波姚亚洲 YANG Wei-jing;XU Rui;GU Hao-wen;CHEN Tao;SHU Xiang-bo;YAO Ya-zhou(School of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing,Jiangsu 210094,China)

机构地区南京理工大学计算机与工程学院

出处《电子学报》北大核心 2025年第3期716-727,共12页 Acta Electronica Sinica

基金国家自然科学基金(No.62302217) 装备发展部信息系统共用技术预研项目(No.31511030202)。

关键词大规模无监督语义分割图像级去噪分割一切模型伪标签聚类 large-scale unsupervised semantic segmentation image-level denoising segment anything model pseudo-label clustering

分类号 TP751 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1梁新宇,林洗坤,权冀川,肖铠鸿.基于深度学习的图像实例分割技术研究进展[J].电子学报,2020,48(12):2476-2486. 被引量：34
2蔡超丽,李纯纯,黄琳,杨铁军.ED-NAS:基于神经网络架构搜索的陶瓷晶粒SEM图像分割方法[J].电子学报,2022,50(2):461-469. 被引量：8

二级参考文献17

1刘伟.基于Kinect遮挡条件下行人的深度图像分割[J].重庆邮电大学学报（自然科学版）,2014,26(2):271-275. 被引量：4
2邓琉元,杨明,王春香,王冰.基于环视相机的无人驾驶汽车实例分割方法[J].华中科技大学学报（自然科学版）,2018,46(12):24-29. 被引量：11
3张国光.基于神经网络的有遮挡图像分割方法[J].电子科技,2015,28(5):132-135. 被引量：6
4师晓利,尚怡君,褚玉晓.安防监控中人员遮挡区域的有效图像分割研究[J].计算机仿真,2015,32(6):452-455. 被引量：3
5张利欣,徐正光,魏帅岭,任学冲,王美玲.基于模糊逻辑的7050铝合金晶粒度自动分析方法的研究（英文）[J].稀有金属材料与工程,2016,45(3):548-554. 被引量：7
6宫进昌,赵尚义,王远军.基于深度学习的医学图像分割研究进展[J].中国医学物理学杂志,2019,36(4):420-424. 被引量：31
7寇大磊,权冀川,张仲伟.基于深度学习的目标检测框架进展研究[J].计算机工程与应用,2019,55(11):25-34. 被引量：69
8姜立标,台啟龙.基于实例分割方法的复杂场景下车道线检测[J].机械设计与制造工程,2019,48(5):113-118. 被引量：9
9谢元澄,于增源,姜海燕,金前,蔡娜娜,梁敬东.小麦麦穗几何表型测量的精准分割方法研究[J].南京农业大学学报,2019,42(5):956-966. 被引量：6
10赵阳,王剑,曹浩男.基于自适应改进的遥感图像去雾算法研究[J].电子设计工程,2019,27(19):164-169. 被引量：7

共引文献39

1孙晖,杨艾炯,李康博,孟浩楠,牛立刚.基于深度学习的眼角膜图像自动化分析研究[J].吉林大学学报（信息科学版）,2021,39(5):609-616. 被引量：3
2苏丽,孙雨鑫,苑守正.基于深度学习的实例分割研究综述[J].智能系统学报,2022,17(1):16-31. 被引量：44
3杜永龙,张毅,王龙,郭纬愉,程相伟,张大旭.基于深度学习的平纹C_(f)/SiC复合材料原位拉伸损伤演化与断裂分析[J].硅酸盐通报,2022,41(1):249-257. 被引量：11
4姬江涛,刘晓航,赵凯旋.基于SOLOv2与点云空腔特征的奶牛瘤胃充盈度自动评分方法[J].农业工程学报,2022,38(4):186-197.
5张凌明,赵悦,李鹏程,刘洋,高陈强.基于局部注意力机制的三维牙齿模型分割网络[J].电子学报,2022,50(3):681-690. 被引量：6
6Pan Xiaoying,Wei Miao,Wang Hao,Jia Fengzhu.Multi-scale fusion residual encoder-decoder approach for low illumination image enhancement[J].The Journal of China Universities of Posts and Telecommunications,2022,29(2):63-72.
7任莎莎,刘琼.小目标特征增强图像分割算法[J].电子学报,2022,50(8):1894-1904. 被引量：9
8韩彦芳,杨海马,杨志豪,张裕聪,王紫菲.复杂场景下隧道电缆图像分割算法[J].包装工程,2022,43(21):169-180. 被引量：1
9周震,李莹,柳德云,吉根林.基于运动跟踪与特征融合的视频实例分割方法[J].计算机技术与发展,2022,32(11):43-49.
10周涛(综述),赵雅楠(综述),陆惠玲(综述),侯森宝(综述),郑小敏(审校).医学图像实例分割:从有候选区域向无候选区域[J].生物医学工程学杂志,2022,39(6):1218-1232. 被引量：8

1李慧敏.场景理论下数字游戏中的传统文化的创新传播策略——以《黑神话:悟空》为例[J].新闻传播科学,2025,13(5):824-831.
2梅婷,赵敬伟,林珊玲,谢子昱,林志贤,郭太良.基于YOLACTR的无锚框实例分割算法[J].光电工程,2025,52(5):11-23. 被引量：1
3陈羽中,林闽沪,陈友昆,牛玉贞.基于多重注意力机制的图像雨滴去除方法[J].计算机辅助设计与图形学学报,2025,37(5):894-904.
4王振刚,陈克锐,何明进,刘军,赵一龙.基于无人机激光雷达技术的电网线路间隔棒倾斜缺陷识别[J].电网与清洁能源,2025,41(6):92-98.
5夏晓华,苏建功,刘洋,李明臻,陈仕旗.沥青路面航拍图像的车道区域提取方法[J].公路交通科技,2025,42(5):108-117.
6张欣,张四海.抗标签噪声的鲁棒电信诈骗检测方法[J].数字通信世界,2025(6):53-55.
7潘丽娜.基于人本管理思想的学生管理模式创新研究[J].黄河科技学院学报,2025,27(7):96-100.
8罗志珍,阎静.生成式人工智能驱动下的数字文化消费:现实审思与进路寻择[J].电子商务评论,2025,14(6):1719-1725. 被引量：1
9马媛媛,赵颖澳,张祎,张倩倩,罗向阳.基于S&P和Rec-Net的图像隐蔽通信主动防御方法[J].计算机学报,2025,48(4):985-1011.
10韦炎炎,毛天一,李柏昂,王飞,李锋,张召,赵洋.视觉模型及多模态大模型推进图像复原增强研究进展[J].中国图象图形学报,2025,30(5):1197-1219. 被引量：3

电子学报

2025年第3期

浏览历史

内容加载中请稍等...

基于伪标签去噪和SAM优化的大规模无监督语义分割

参考文献2

二级参考文献17

共引文献39

相关作者

相关机构

相关主题

浏览历史