-
题名概念嵌入增强的可解释图像聚类
- 1
-
-
作者
王翔
刘华锋
景丽萍
于剑
郭龙腾
杨雅君
-
机构
先进轨道交通自主运行全国重点实验室(北京交通大学)
交通数据挖掘与具身智能北京市重点实验室(北京交通大学)
北京交通大学计算机科学与技术学院
中国科学院自动化研究所
天津大学智能与计算学部
-
出处
《计算机学报》
北大核心
2026年第4期742-759,共18页
-
基金
国家自然科学基金(62436001,62406019,62176020)
国家重点研发计划项目(2024YFE0202900)
+5 种基金
北京市自然科学基金(4244096)
北京市自然科学基金(4244096)
北交大人才基金(2024XKRC075)
教育部创新团队联合基金(8091B042235)
中央高校基础研究基金(2019JBZ110)
北京交通大学轨道交通控制与安全国家重点实验室(RCS2023K006)资助。
-
文摘
作为无监督学习领域的基础性任务,聚类分析在众多数据场景中具有核心应用价值。当其与深度神经网络及大语言模型集成时,所形成的深度聚类技术展现出解析高维图像数据复杂结构的强大能力。然而,现有深度聚类方法通常采用隐式方式耦合数据的全部特征维度,以捕获非线性流形结构。这种“黑箱”特性导致模型决策难以被直观解析,进而限制了其在城市规划、医疗诊断等高风险敏感领域的应用。为应对上述挑战,本文提出一种概念嵌入增强的可解释图像聚类框架,通过跨模态语义转换机制提升聚类结果的可解释性。具体而言,本文创新地构建了一个数据自适应的文本概念生成器,能够在无监督标签缺失的条件下,自动挖掘数据集中潜在的高层语义概念;同时,设计了概念表征对齐模块和聚类决策修正模块,使模型在保持聚类性能的基础上,能够输出符合人类认知的语义解释。在六个基准图像数据集上的实验表明,所提方法不仅在聚类准确性方面表现优越,同时也显著提升了聚类结果的可解释性。
-
关键词
可解释聚类
图像聚类
概念瓶颈模型
自监督学习
最大编码率约束
-
Keywords
interpretable clustering
image clustering
concept bottleneck model
self-supervised learning
maximal coding rate reduction
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名变分信息瓶颈引导的互补概念瓶颈模型
- 2
-
-
作者
冀中
林子杰
-
机构
天津大学电气自动化与信息工程学院
-
出处
《计算机科学与探索》
北大核心
2025年第11期2950-2966,共17页
-
基金
国家自然科学基金(62176178)。
-
文摘
概念瓶颈模型(CBM)将黑盒模型提取的视觉特征表示映射到一组可解释的概念上,并利用概念进行决策。最新提出的方法主要利用大语言模型(LLM)生成文本概念,通过多模态预训练模型将视觉表示与文本概念嵌入相匹配。然而这些方法也将文本噪声注入了概念瓶颈,导致输出的文本解释与图像内容不匹配或与视觉属性无关。针对上述问题,提出了基于变分信息瓶颈引导的互补概念瓶颈模型。设计一种基于思维链(CoT)技术的概念生成方法,提示视觉语言模型(VLM)和大语言模型分别输出更加准确且互补的文本描述。构建一个基于变分信息瓶颈特征归因方法的概念筛选模块,提取文本描述中与图像内容相关性最高的文本概念。设计一种基于互补概念瓶颈的图像分类方法,结合双支路的概念激活得分进行决策。为了评估概念瓶颈模型输出解释的简洁性和有效性,提出了可解释性效率指标。在6个公开数据集上的实验表明,该算法在可解释性效率方面优于其他5个最新模型,同时达到相近甚至更优的准确率。
-
关键词
概念瓶颈模型
变分信息瓶颈
特征归因
可解释性
-
Keywords
concept bottleneck models
variational information bottleneck
feature attribution
interpretability
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-