极其弱监督场景下的小样本图异常检测被引量：2

Few-Shot Graph Anomaly Detection with Extremely Weak Supervision

下载PDF

导出

摘要近年来,小样本图异常检测在各个领域中引起了广泛的研究兴趣,其旨在在少量有标记训练节点(支持集)的引导下去检测出大量无标记测试节点(查询集)中的异常行为。然而,现有的小样本图异常检测算法通常假设其可以从具有大量有标记节点的训练任务(元训练任务)中学习,从而有效地推广到具有少量标记节点的测试任务(元测试任务),这一假设并不符合真实世界的应用条件。在实际应用中,用于小样本图异常检测训练的元训练任务通常只包含极其有限的有标记节点,其标签占比通常不超过0.1%,甚至更低。由于元训练和元测试任务之间存在的巨大任务差异,现有的小样本图异常检测算法很容易出现模型的过拟合问题。除此之外,现有的小样本图异常检测算法仅利用节点间的一阶邻域(局部结构信息)来学习节点的低维特征嵌入,反而忽略了节点间的长距离依赖关系(全局结构信息),进而导致学习到的低维特征嵌入的不准确性和失真问题。针对上述挑战,本文提出了极其弱监督场景下的小样本图异常检测算法——EWSFSGAD。具体来说,该方法首先提出了一个简单且有效的图神经网络框架——GLN(Global and Local Network),其能够同时有效地利用节点间的全局和局部结构信息,并进一步引入注意力机制实现节点间的信息交互,从而更加有效地学习节点鲁棒的低维特征嵌入;该方法还引入了图对比学习中的自监督重建损失,使得节点原始视图与其增强视图之间低维特征嵌入的互信息尽可能一致,为EWS-FSGAD模型的优化提供更多有效的自监督信息,进而提升模型的泛化性;为了提升模型在真实场景中小样本图异常检测任务的快速适应性,该方法引入跨网络元学习训练机制,从多个辅助网络学习可迁移元知识,为模型提供良好的参数初始化,从而能够通过在仅有很少甚至一个标记节点的目标网络上进行微调并有效泛化。在三个真实世界的数据集(Flickr、PubMed、Yelp)上的大量实验结果表明,本文所提方法的性能明显优于现有的图异常检测算法。特别是在PubMed数据集上,AUC-PR提升了28.8%~35.4%。这些实验结果强有力地证明了在极其有限标记的元训练任务引导下,本文所提方法能够更好地学习到异常节点本质特征,从而提升小样本图异常检测任务的有效性。 In recent years,few-shot graph anomaly detection(FS-GAD)has received extensive research interest across various applications,which aims to distinguish anomalous patterns of abundant unlabeled test nodes(query set)under the guidance of a few labeled training nodes(support set).Nevertheless,the existing FS-GAD methods often assume that they can learn metaknowledge from training tasks(meta-training tasks)with abundant labeled nodes,and then effectively generalize to testing tasks(meta-test tasks)with a few labeled nodes.This assumption does not fit with real-world applications.In real-world applications,the meta-training tasks for FSGAD training usually contain only extremely limited labeled nodes,whose proportion of labels usually does not exceed 0.1%or even less.Owing to the large task difference between metatraining and meta-testing tasks,the existing FS-GAD methods are more prone to overfitting problems.In addition,the existing FS-GAD methods only utilize the first-order neighborhood(local structure information)between nodes to learn their low-dimensional node feature embedding,while ignoring the long-range dependencies(global structure information)between nodes,leading to the inaccuracy and distortion of the learned low-dimensional node feature embeddings.In this paper,an effective few-shot graph anomaly detection framework with extremely weak supervision is proposed,termed EWS-FSGAD,to solve the above-mentioned issues.Specifically,a simple and effective graph neural network module~Global and Local Network(GLN)is first proposed to more effectively learn robust low-dimensional node feature embeddings,which simultaneously utilizes the global and local structural information between nodes and also introduces the attention mechanism to realize the information interaction between nodes.And then,we introduce self-supervised reconstruction loss in graph contrast learning to maximize the mutual information between lowdimensional node feature embeddings from the original view and the augmented view,which can provide more effective self-supervised information for model optimization and also further improve the generalization of the proposed EWS-FSGAD.To improve the effectiveness of the proposed EWS-FSGAD method in real-world applications,we introduce the cross-network meta-learning training mechanism to learn transferable meta-knowledge from multiple auxiliary networks and provide good parameters initialization for the proposed EWS-FSGAD model,so that it can quickly adapt to the target network by performing fine-tuning on a few or even one labeled node.Finally,extensive experiments on three real-world benchmarks(Flickr,PubMed,and Yelp)show that the proposed EWS-FSGAD achieves state-of-the-art performance in comparison to the existing graph anomaly detection models.For example,AUC-PR improves by 28.8%~35.4%on the PubMed dataset.These results strongly demonstrate that the proposed EWS-FSGAD can better learn the essential characteristics of abnormal nodes under the guidance of an extremely limited meta-training support set,and further improve the effectiveness of FS-GAD tasks.

作者郑文捷傅司超陈嘉真彭勤牧涂益群邹斌荆晓远尤新革 ZHENG Wen-Jie;FU Si-Chao;CHEN Jia-Zhen;PENG Qin-Mu;TU Yi-Qun;ZOU Bin;JING Xiao-Yuan;YOU Xin-Ge(School of Electronic Information and Communications,Huazhong University of Science and Technology,Wuhan 430074;Department of Statistics and Actuarial Science,University of Waterloo,Waterloo ON N2L 3G1,Canada;Huaneng Wuhan Power Generation Co.Ltd.,Wuhan 430050;Faculty of Mathematics and Statistics,Hubei University,Wuhan 430062;School of Computer Science,Wuhan University,Wuhan 430072)

机构地区华中科技大学电子信息与通信学院滑铁卢大学统计与精算系华能武汉发电有限责任公司湖北大学数学与统计学学院武汉大学计算机学院

出处《计算机学报》北大核心 2025年第4期927-948,共22页 Chinese Journal of Computers

基金国家重点研发计划(2022YFF0712300) 中央高校基本科研业务费(YCJJ20241203)资助。

关键词图异常检测小样本学习极其弱监督图神经网络图对比学习长距离依赖关系 graph anomaly detection few-shot learning extremely weak supervision graph neural networks graph contrastive learning long-range dependency relationships

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1陈曼笙,蔡晓莎,林家祺,王昌栋,黄栋,赖剑煌.张量学习诱导的多视图谱聚类[J].计算机学报,2024,47(1):52-68. 被引量：8
2陈曼笙,任骊安,王昌栋,黄栋,赖剑煌.基于混合阶相似性的多视图聚类:一个广义的视角[J].计算机学报,2024,47(7):1453-1468. 被引量：2
3王悦天,傅司超,彭勤牧,邹斌,荆晓远,尤新革.半监督场景下多视角信息交互的图卷积神经网络[J].软件学报,2024,35(11):5098-5115. 被引量：3

二级参考文献5

1吴烨,钟志农,熊伟,陈荦,景宁.一种高效的属性图聚类方法[J].计算机学报,2013,36(8):1704-1713. 被引量：22
2陈晋音,何辉豪.基于密度的聚类中心自动确定的混合属性数据聚类算法研究[J].自动化学报,2015,41(10):1798-1813. 被引量：39
3康昭,刘亮,韩蒙.基于转换学习的半监督分类[J].计算机研究与发展,2023,60(1):103-111. 被引量：4
4李林珂,康昭,龙波.基于黎曼流形的多视角谱聚类算法[J].计算机工程,2023,49(1):113-120. 被引量：3
5罗辉,韩纪庆.基于灵活平衡约束的图聚类方法[J].自动化学报,2023,49(4):778-789. 被引量：1

共引文献10

1钱华,祁枢杰,顾涔,陶然,吴宏杰.基于近邻卷积神经网络的油画分类方法研究[J].苏州科技大学学报（自然科学版）,2024,41(1):69-75. 被引量：3
2辛永杰,蔡江辉,贺艳婷,苏美红,史晨辉,杨海峰.基于跨结构特征选择和图循环自适应学习的多视图聚类[J].计算机科学,2025,52(2):145-157. 被引量：1
3李国文,丁正扬,冯钰瑶.投资者互动平台服务效能的诊断与优化研究[J].科学决策,2025(1):158-177. 被引量：1
4张正,张永兵,何汶珏.基于“个人—团队”和“课内—课外”双维度协同作用的课程思政路径探索——以机器学习概论课程为例[J].科教文汇,2025(7):119-122.
5梁伟轩,刘新旺,蓝龙,祝恩.关于二部图谱聚类泛化性的研究[J].计算机学报,2025,48(5):1065-1081. 被引量：1
6林合川,徐慧英,朱信忠,黄晓,刘子洋.自加权多视图k-均值算法[J].计算机工程,2025,51(8):141-150.
7张毅,田芷榕,王方地,王思为,刘吉元,刘新旺,祝恩.低秩张量和主动重构诱导的后期融合多核聚类[J].计算机学报,2025,48(9):1991-2007.
8梁科,马慧敏,刘溯源,刘新旺.知识引导的基于锚图学习的多视图聚类方法研究[J].计算机学报,2025,48(8):1749-1762.
9李婷文,张建华.基于视频图像阈值分割的网球运动员眼球运动轨迹捕捉优化研究[J].西南大学学报(自然科学版),2025,47(10):208-220.
10史德胜,徐鹤,李鹏.基于张量低秩学习的多视图子空间聚类方法[J].数据采集与处理,2026,41(1):215-230.

同被引文献29

1董骁翀,孙英云,蒲天骄.基于条件生成对抗网络的可再生能源日前场景生成方法[J].中国电机工程学报,2020,40(17):5527-5535. 被引量：92
2李忠,靳小龙,庄传志,孙智.面向图的异常检测研究综述[J].软件学报,2021,32(1):167-193. 被引量：21
3安学民,孙华东,张晓涵,冀鲁豫,孙为民,屠竞哲,何剑,周勤勇.美国得州“2.15”停电事件分析及启示[J].中国电机工程学报,2021,41(10):3407-3415. 被引量：56
4罗魁,石文辉.面向风电接入暂态功角稳定分析的电网极端运行场景提取[J].电力系统自动化,2021,45(20):113-120. 被引量：14
5兰健,郭庆来,周艳真,孙宏斌.基于生成对抗网络和模型迁移的电力系统典型运行方式样本生成[J].中国电机工程学报,2022,42(8):2889-2899. 被引量：24
6刘华玲,张国祥,马俊.图嵌入算法研究进展[J].浙江大学学报（理学版）,2022,49(4):443-456. 被引量：3
7刘映尚,马骞,王子强,李鹏,刘春晓.新型电力系统电力电量平衡调度问题的思考[J].中国电机工程学报,2023,43(5):1694-1705. 被引量：72
8Nantian Huang,Wenting Wang,Guowei Cai.Optimal Configuration Planning of Multi-energy Microgrid Based on Source-load-temperature Scenarios Deep Joint Generation[J].CSEE Journal of Power and Energy Systems,2023,9(3):1090-1102. 被引量：3
9米阳,卢长坤,申杰,杨熙,葛磊蛟.基于条件生成对抗网络的风电功率极端场景生成[J].高电压技术,2023,49(6):2253-2263. 被引量：30
10刘鸿鹏,李宏伟,马建伟,陈继开,张伟.考虑源-荷不确定性的电热联合系统分布鲁棒优化调度[J].电力自动化设备,2023,43(8):1-8. 被引量：11

引证文献2

1王淇炜,李勇,顾益军.基于伪标签构造与排序建模的资金网络异常账户识别方法研究[J].中国人民公安大学学报(自然科学版),2025,31(4):64-75.
2许传宇,李晟,王继业,刘宗洋,艾小猛,方家琨,文劲宇.面向风电极端事件日前场景生成的泛化迁移学习方法[J].电力系统自动化,2026,50(6):156-169.

1敬小芳.新课标背景下小学语文大单元教学的实践路径研究[J].故事家(上),2025(16):0037-0039.
2柯淑琴.大单元视角下小学语文教学中传统文化的融入策略[J].福建教育研究,2025(4):37-39.
3毛青青,贾洪杰,朱必松.面向说话人日志的多原型驱动图神经网络方法[J].计算机应用研究,2025,42(6):1778-1783. 被引量：1
4李沙,黄江林.课程思政融入智慧体育教学的价值意蕴与实践路径[J].青少年体育,2024(11):35-37.
5陈晰,程戈,尹智斌.融合异构图全局结构信息和时间序列的专利价值评估方法[J].情报杂志,2025,44(7):199-206. 被引量：3
6马瑞雪.新课改背景下初中地理大单元教学的实施策略[J].文学与人生,2022(4):16-18.
7张洪广,杨翕然.基于联邦自适应元优化的分布式协同学习方法[J].指挥信息系统与技术,2025,16(2):1-8.
8丁蓉.无线传感器网络中基于子图的异常检测方法[J].信息记录材料,2025,26(6):78-79.
9刘永涛.基于学习进阶理论的单元教学设计——以“动量守恒定律”单元为例[J].中学物理教学参考,2025,54(18):32-35. 被引量：1
10卢翠玲.基于整体观的初中数学概念教学[J].中学数学,2025(12):48-49.

计算机学报

2025年第4期

浏览历史

内容加载中请稍等...

极其弱监督场景下的小样本图异常检测被引量：2

参考文献3

二级参考文献5

共引文献10

同被引文献29

引证文献2

相关作者

相关机构

相关主题

浏览历史

极其弱监督场景下的小样本图异常检测 被引量：2

参考文献3

二级参考文献5

共引文献10

同被引文献29

引证文献2

相关作者

相关机构

相关主题

浏览历史

极其弱监督场景下的小样本图异常检测被引量：2