-
题名基于图的稀疏注意力实例分割算法
- 1
-
-
作者
李森
王晓明
-
机构
西华大学计算机与软件工程学院
-
出处
《现代电子技术》
北大核心
2026年第1期86-94,共9页
-
基金
四川省科技计划重点研究项目(2023YFG0098)。
-
文摘
视觉图神经网络(Vision GNN)为计算机视觉提供了新范式,但基础模型ViG依赖KNN构图导致计算成本高昂。随后提出的Mobile ViG虽采用稀疏视觉图注意力(SVGA)提升效率,但其静态构图限制了全局特征获取。为此,文中提出全局稀疏视觉图注意力(GSVGA)模型,GSVGA通过连接图像行、列及对角线像素构建新型稀疏矩阵,解决了SVGA特征丢失问题,且无需耗时的张量重构操作。该模型引入最大相对图卷积,利用向左、右、下维度的滚动操作实现特征聚合,并结合扩张卷积扩大感受野,可以获取更多的特征信息。此外,模块集成了更新后的前馈网络,并选用GELU激活函数以提升大规模计算下特征变换的稳定性。实验结果显示,GSVGA在COCO 2017、iSAID和BDD100K数据集上表现优异;在推理效率上,GSVGA随迭代增加耗时显著降低;GSVGA在ImageNet-1K上的准确率为88.12%;中等目标实例分割的mAP@0.5:0.95为0.675 1,且测试集误差为对比算法中的最小值。可视化结果证明,GSVGA能更精确分割单一及多个实例,具备极强的泛化能力与小目标检测能力。
-
关键词
视觉图神经网络
稀疏矩阵
注意力机制
实例分割
消融实验
全局稀疏视觉图注意力
-
Keywords
vision GNN
sparse matrix
attention mechanism
instance segmentation
ablation experiment
gsvga
-
分类号
TN911.73-34
[电子电信—通信与信息系统]
TP391.41
[自动化与计算机技术—计算机应用技术]
-