期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
显式语义解耦与软提示驱动的组合零样本识别
1
作者 刘杰 陶重犇 +2 位作者 沈忠伟 罗喜召 曹峰 《中国图象图形学报》 2026年第3期850-861,共12页
目的组合零样本学习(compositional zero-shot learning,CZSL)的目标是识别未见的状态—物体组合。然而,现有方法普遍存在状态与物体特征混淆,以及跨模态语义对齐不足的问题,导致模型在未见组合上的泛化能力受限。本文提出一种融合显式... 目的组合零样本学习(compositional zero-shot learning,CZSL)的目标是识别未见的状态—物体组合。然而,现有方法普遍存在状态与物体特征混淆,以及跨模态语义对齐不足的问题,导致模型在未见组合上的泛化能力受限。本文提出一种融合显式语义解耦与软提示机制的跨模态组合零样本识别方法,旨在通过显式语义解耦与软提示机制,提升模型在组合零样本识别中的表现。方法在语言模态端,构建可学习的软提示结构,生成结构化语义引导信号以增强状态与物体的区分性;在视觉模态端,基于变分自编码器(variational autoencoder,VAE)设计显式语义解耦机制,将图像特征划分为状态与物体两个子空间,并引入对抗判别器,通过对抗训练强化特征独立性和判别性。进一步地,提出跨模态关系融合模块,实现语言与视觉语义的有效对齐。结果在MIT-States、UT-Zappos和C-GQA(compositional GQA)3个基准数据集上进行的实验表明,本文方法在未见组合识别任务中取得了显著优势。在MIT-States数据集上的未见组合准确率达到54.2%,较当前最佳方法提升1.3%;在UT-Zappos和C-GQA数据集上,同样实现了超过现有方法的性能提升。消融实验与可视化分析验证了软提示结构、语义解耦机制与对抗判别器的有效性。结论本文提出的跨模态组合零样本识别方法有效缓解了状态与物体特征混淆以及跨模态语义不对齐的问题,显著提升了模型在未见组合上的泛化能力。该方法为组合零样本学习提供了一种结构清晰、泛化性能优越的新范式,具有重要的理论意义与应用价值。 展开更多
关键词 组合零样本学习(czsl) 语义解耦 跨模态对齐 软提示 对抗训练
原文传递
面向组合零样本识别的图文解耦合方法
2
作者 田弋 钱毅鑫 +3 位作者 黄清宝 陈佳岳 钟磊 伍贤瑞 《中国图象图形学报》 2026年第3期826-839,共14页
目的组合零样本识别是计算机视觉领域零样本学习任务的子任务,旨在从已经见过的组合图像中学习属性和物体概念,并将其迁移到未见过的组合上。现有方法对组合图像中属性和物体的解耦合能力不足,并且未能充分发挥文本标签对于属性和物体... 目的组合零样本识别是计算机视觉领域零样本学习任务的子任务,旨在从已经见过的组合图像中学习属性和物体概念,并将其迁移到未见过的组合上。现有方法对组合图像中属性和物体的解耦合能力不足,并且未能充分发挥文本标签对于属性和物体信息的解耦合作用。方法为解决组合图像中属性与物体信息纠缠的问题,针对文本与视觉模态的差异,提出双模态解耦机制:在文本端构建图神经网络以建模属性与物体间的语义关系,在视觉端引入交叉注意力机制增强对属性和物体特征的分离能力。该方法集成于语言图像预训练框架中,从语言与视觉两个层面提升模型对属性与物体概念的建模能力,从而增强未见组合的识别效果。结果在3个主流的组合零样本识别基准数据集MIT-States、UT-Zappos和C-GQA(compositional GQA)上对所提方法进行了系统评估,结果表明模型性能显著提升。以MIT-States数据集为例,在封闭世界设置下,相较于性能排名第2的模型,本文方法的AUC(area under curve)提升3.3%,HM(Harmonic mean)提升2.4%,已见组合的识别准确率提升5.3%,未见组合提升1.0%;在开放世界设置下,本文方法的AUC提升0.9%,HM提升0.7%,已见组合与未见组合准确率分别提升3.2%和1.0%。此外,在MIT-States数据集上对提出的文本与视觉解耦模块及其上下文建模组件进行了消融实验,进一步验证了各子模块对整体性能的有效贡献。结论所提出的图文双端解耦合模块提升了模型对于组合中属性和物体的学习能力,显著提升了模型在组合零样本识别任务上的表现。 展开更多
关键词 零样本学习(ZSL) 组合零样本识别(czsl) 解耦合 图卷积网络(GCN) 交叉注意力 对比语言图像预训练(CLIP)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部