基于显著性掩模混合的小样本图像分类被引量：1

Saliency Mask Mixup for Few-shot Image Classification

下载PDF

导出

摘要小样本图像分类解决了传统图像分类在数据量不足时表现不佳的问题,其难点在于如何充分利用稀缺的样本标签数据预测真实的特征分布。一些最新方法采用随机遮挡或混合插值等数据增强方法来提高数据标签样本的多样性和泛化性,但仍然存在以下问题:1)随机遮挡具有不确定性,会出现完全遮挡或暴露前景的情况,导致样本关键信息丢失;2)由于混合插值后的数据分布过于平均,模型难以准确区分不同类别之间的差异和边界。针对上述问题,提出一种基于显著性掩模混合的数据增强方法。首先,通过视觉特征隐蔽融合和置信度裁剪选择策略,对图像关键特征信息进行自适应的筛选与保留;其次,采用视觉特征显著性融合方法,计算出图片中各个区域的重要性,引导图片融合,增加所得图片的多样性和丰富性,使类别边界更加清晰。所提方法在多个标准小样本图像分类数据集(miniImageNet,tieredImageNet,Few-shot CIFAR100和Caltech-UCSD Birds-200)上表现出色,优于最先进方法约0.2%~1%,在小样本图像分类中具有显著的潜力和优势。 Few-shot image classification addresses the problem of poor performance in traditional image classification when data is scarce.The challenge lies in effectively utilizing sparse sample label data to predict the true feature distribution.To tackle this,some recent methods adopt data augmentation techniques such as random mas-king or mixed interpolation to enhance the diversity and generalization of data label samples.However,there are still the following issues:1)Due to the uncertainty of random masking,situations where the foreground is either completely masked or exposed may occur,leading to the loss of crucial information in samples;2)Because the data distribution after mixed interpolation tends to be overly uniform,models find it difficult to accurately distinguish differences between different classes,thus failing to effectively delineate boundaries between different categories.To address these problems,this paper proposes a data augmentation method based on Saliency Mask Mixup.Firstly,through Mask Mix(M-Mix)and Confident Clip Selector(CCS),adaptive selection and retention of key feature information in images are performed.Secondly,using Saliency Fuse(SF),the importance of various regions in the image is calculated to guide image fusion,making the resulting images more diverse and rich,thereby making category boundaries clearer.The proposed method demonstrates outstanding performance on multiple standard few-shot image classification datasets(such as miniImage-Net,tiered-ImageNet,Few-shot CIFAR100,and Caltech-UCSD Birds-200),outperforming state-of-the-art methods by approximately 0.2~1%.These results indicate significant potential and advantages of the proposed method in few-shot image classification.

作者陈亚当高宇轩卢楚翰车洵 CHEN Yadang;GAO Yuxuan;LU Chuhan;CHE Xun(School of Computer Science,Nanjing University of Information Science and Technology,Nanjing 210044,China;School of Computer Science and Engineering,Nanjing University of Science and Technology,Nanjing 210094,China)

机构地区南京信息工程大学计算机学院南京理工大学计算机科学与工程学院

出处《计算机科学》北大核心 2025年第6期256-263,共8页 Computer Science

基金国家自然科学基金(62473201,62477026) 江苏省重点研发计划产业前瞻与关键核心技术项目(BE2022161) 无锡市产业创新研究院先导技术预研项目。

关键词小样本学习图像分类对比学习数据混合数据增强显著图 Few-shot learning Image classification Contrastive learning Date mixing Data augmentation Saliency map

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1邓戈龙,黄国恒,陈紫嫣.图神经网络的类别解耦小样本分类[J].计算机工程与应用,2024,60(2):129-136. 被引量：1
2陶鹏,冯林,杜彦东,龚勋,王俊.面向元余弦损失的少样本图像分类[J].中国图象图形学报,2024,29(2):506-519. 被引量：5
3郭璐,刘斌,李维刚,甘平.基于困难样本对激励的小样本图像分类方法[J].计算机辅助设计与图形学学报,2024,36(6):895-903. 被引量：3
4刘昊,田志宏,仇晶,刘园,方滨兴.面向小样本的恶意软件检测综述[J].软件学报,2024,35(8):3785-3808. 被引量：2
5李凡,贾东立,姚昱旻,涂俊.结合残差与自注意力机制的图卷积小样本图像分类网络[J].计算机科学,2023,50(S01):366-370. 被引量：5
6Yadang CHEN,Chuanyan HAO,Zhi-Xin YANG,Enhua WU.Fast target-aware learning for few-shot video object segmentation[J].Science China(Information Sciences),2022,65(8):67-82. 被引量：4
7陈亚当,陈柳任,余文斌,朱加乐.多尺度特征融合的知识蒸馏异常检测方法[J].计算机辅助设计与图形学学报,2022,34(10):1542-1549. 被引量：4

二级参考文献40

1周长利,马春光,杨松涛.路网环境下保护LBS位置隐私的连续KNN查询方法[J].计算机研究与发展,2015,52(11):2628-2644. 被引量：24
2Yadang CHEN,Chuanyan HAO,Wen WU,Enhua WU.Robust dense reconstruction by range merging based on confidence estimation[J].Science China(Information Sciences),2016,59(9):18-28. 被引量：3
3李晨,申德荣,朱命冬,寇月,聂铁铮,于戈.一种对时空信息的kNN查询处理方法[J].软件学报,2016,27(9):2278-2289. 被引量：11
4周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：2014
5朱利,邱媛媛,于帅,原盛.一种基于快速k-近邻的最小生成树离群检测方法[J].计算机学报,2017,40(12):2856-2870. 被引量：31
6陈亚当,郝川艳.动态双边网格实现的视频前景分割算法[J].计算机辅助设计与图形学学报,2018,30(11):2101-2107. 被引量：3
7田萱,王亮,丁琪.基于深度学习的图像语义分割方法综述[J].软件学报,2019,30(2):440-468. 被引量：278
8陈琪,张莉,蒋竞,黄新越.一种基于支持向量机和主题模型的评论分析方法[J].软件学报,2019,30(5):1547-1560. 被引量：27
9曾志超,李桂清,邹歆仪,王宇攀,聂勇伟.三维人体模型姿态与形状重构[J].计算机辅助设计与图形学学报,2019,31(9):1485-1493. 被引量：10
10余游,冯林,王格格,徐其凤.一种基于伪标签的半监督少样本学习模型[J].电子学报,2019,47(11):2284-2291. 被引量：15

共引文献16

1黄少年,文沛然,全琪,陈荣元.基于多支路聚合的帧预测轻量化视频异常检测[J].图学学报,2023,44(6):1173-1182. 被引量：3
2李亚康,陈刚.小角中子散射物理模型自动化筛选[J].计算机工程,2024,50(6):56-64. 被引量：1
3齐露露,俞卫琴.结合图神经网络的小样本图像分类方法[J].无线电工程,2024,54(7):1668-1675.
4Tianshu YU,Changqun XIA,Jia LI.Towards imbalanced motion:part-decoupling network for video portrait segmentation[J].Science China(Information Sciences),2024,67(7):193-206.
5杨希洪,郑群,章佳欣,王沛,祝恩.基于特征插值的深度图对比聚类算法[J].计算机科学,2024,51(11):157-165. 被引量：2
6梅光.基于改进U-Net卷积神经网络的数字图像智能分类方法[J].长江信息通信,2024,37(10):57-59. 被引量：1
7包春梅,王前,陈望,李志玲,王彬,王林.基于混合注意力的布朗距离协方差小样本图像分类算法[J].湖北民族大学学报（自然科学版）,2024,42(4):521-527. 被引量：1
8柏嵩,胡月文.基于人工智能的恶意软件检测与防御机制[J].电脑知识与技术,2024,20(36):36-38. 被引量：5
9邵晓艳,王军,赵雪专,王胜,冯军.基于ATD-CNN模型的黄河郑州段水面漂浮物检测研究[J].人民黄河,2025,47(2):131-136.
10黎林发,王岳.基于CAM-DenseNet模型的邮轮薄板焊缝缺陷识别算法[J].造船技术,2025,53(1):78-84.

同被引文献5

1Wenhai Wang,Enze Xie,Xiang Li,Deng-Ping Fan,Kaitao Song,Ding Liang,Tong Lu,Ping Luo,Ling Shao.PVT v2:Improved baselines with Pyramid Vision Transformer[J].Computational Visual Media,2022,8(3):415-424. 被引量：131
2李峻宇,刘乾坤,付莹.融合注意力机制的红外小目标检测[J].航空学报,2024,45(14):84-95. 被引量：12
3陈灿森,刘巍.Leakage-YOLO:隧道场景下裂缝漏水的实时目标检测算法[J].计算机工程与应用,2025,61(6):118-127. 被引量：2
4盛威,周永霞,陈俊杰,赵平.基于YOLOv8-S的偏光片表面缺陷检测算法[J].计算机工程与应用,2025,61(6):128-140. 被引量：1
5赵宇,魏巍,岳琴,王锋.标签引导的图神经网络小样本图像分类方法[J].小型微型计算机系统,2025,46(10):2424-2430. 被引量：1

引证文献1

1张鑫,智敏,萨茹拉,阿日木扎.视觉Mamba:结构、应用与前景[J].计算机科学与探索,2026,20(1):66-78.

1裴雅鹏,高雅,张俊祺,杨军.国际单位制基本单位新定义及光量子实现方法[J].红外与激光工程,2025,54(5):228-235.
2Jun Niu,Peng Liu,Chunhui Huang,Yangming Zhang,Moxuan Zeng,Kuo Shen,Yangzhong Wang,Suyu An,Yulong Shen,Xiaohong Jiang,Jianfeng Ma,He Wang,Gaofei Wu,Anmin Fu,Chunjie Cao,Xiaoyan Zhu,Yuqing Zhang.Dual defense:Combining preemptive exclusion of members and knowledge distillation to mitigate membership inference attacks[J].Journal of Information and Intelligence,2025,3(1):68-90.
3申敏夏,方增泉,陶真,陶勇.AI时代,家庭教育如何破局?[J].中国妇女,2024(11):28-31.
4徐子阳,周绍光,葛莹,万子豪.基于模型蒸馏的无标签城市道路遥感自动提取[J].时空信息学报,2025,32(2):113-126. 被引量：1
5谷艳红,李凡丁,年福东.基于半监督度量学习的激光诱导击穿光谱检测白芍中的重金属含量[J].分析化学,2025,53(4):669-679.
6李灿,罗军,赵树标,钟志贤,王广斌.基于分层多元域适应的滚动轴承故障诊断方法[J].机床与液压,2025,53(8):9-17. 被引量：1
7董黎明,张贺,孟庆龙,匡宏宇.结合主动学习和半监督学习的软件可追踪性恢复框架[J].软件学报,2025,36(5):1924-1948.
8魏松杰,吴琴琴,袁军翼.基于运行参数增强API序列的勒索软件动态检测方法研究[J].信息网络安全,2025(5):713-721. 被引量：1
9张桂梅,闫文尚,黄军阳.结合双重对比嵌入学习的生成式零样本图像识别[J].中国图象图形学报,2025,30(5):1389-1403.

计算机科学

2025年第6期

浏览历史

内容加载中请稍等...

基于显著性掩模混合的小样本图像分类被引量：1

参考文献7

二级参考文献40

共引文献16

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于显著性掩模混合的小样本图像分类 被引量：1

参考文献7

二级参考文献40

共引文献16

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于显著性掩模混合的小样本图像分类被引量：1