期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
UniTrans:Unified Parameter-Efficient Transfer Learning and Multimodal Alignment for Large Multimodal Foundation Model
1
作者 Jiakang Sun Ke Chen +3 位作者 Xinyang He Xu Liu Ke Li Cheng Peng 《Computers, Materials & Continua》 2025年第4期219-238,共20页
With the advancements in parameter-efficient transfer learning techniques,it has become feasible to leverage large pre-trained language models for downstream tasks under low-cost and low-resource conditions.However,ap... With the advancements in parameter-efficient transfer learning techniques,it has become feasible to leverage large pre-trained language models for downstream tasks under low-cost and low-resource conditions.However,applying this technique to multimodal knowledge transfer introduces a significant challenge:ensuring alignment across modalities while minimizing the number of additional parameters required for downstream task adaptation.This paper introduces UniTrans,a framework aimed at facilitating efficient knowledge transfer across multiple modalities.UniTrans leverages Vector-based Cross-modal Random Matrix Adaptation to enable fine-tuning with minimal parameter overhead.To further enhance modality alignment,we introduce two key components:the Multimodal Consistency Alignment Module and the Query-Augmentation Side Network,specifically optimized for scenarios with extremely limited trainable parameters.Extensive evaluations on various cross-modal downstream tasks demonstrate that our approach surpasses state-of-the-art methods while using just 5%of their trainable parameters.Additionally,it achieves superior performance compared to fully fine-tuned models on certain benchmarks. 展开更多
关键词 Parameter-efficient transfer learning multimodal alignment image captioning image-text retrieval visual question answering
在线阅读 下载PDF
基于多模态知识库的透平机组智能问答运维系统研究
2
作者 劳新力 姜彬 +2 位作者 昝智海 马连瑞 刘冲 《黑龙江科学》 2025年第22期100-103,共4页
提出一种基于多模态知识库的透平机组智能运维系统,以解决传统运维方式中效率低下、安全性不足及诊断不精准问题。系统通过整合文本、图像、结构化标签等多源信息构建了一个高效的知识表示框架,并结合大语言模型与图文对齐技术实现了对... 提出一种基于多模态知识库的透平机组智能运维系统,以解决传统运维方式中效率低下、安全性不足及诊断不精准问题。系统通过整合文本、图像、结构化标签等多源信息构建了一个高效的知识表示框架,并结合大语言模型与图文对齐技术实现了对透平机组运维知识的智能化管理与问答服务。实验结果表明,该系统能够显著提升运维效率,降低运维成本,为透平机组的稳定运行提供了有力保障。 展开更多
关键词 多模态知识库 透平机组 智能运维 大语言模型 图文对齐 知识检索 智能问答
在线阅读 下载PDF
多模态智能中的跨模态迁移学习策略研究
3
作者 简丽琼 《信息与电脑》 2024年第22期180-182,共3页
文章深入探讨了多模态智能领域中跨模态迁移学习的策略及其应用。首先,文章回顾了跨模态迁移学习的基本概念和主要方法,然后详细分析了三种主流策略:特征对齐、知识蒸馏和元学习。通过对比实验,文章评估了这些策略在不同多模态任务中的... 文章深入探讨了多模态智能领域中跨模态迁移学习的策略及其应用。首先,文章回顾了跨模态迁移学习的基本概念和主要方法,然后详细分析了三种主流策略:特征对齐、知识蒸馏和元学习。通过对比实验,文章评估了这些策略在不同多模态任务中的效果,并提出了一种融合多种策略的新方法。实验结果表明,该方法在图像-文本检索、跨语言情感分析等任务中取得了显著的性能提升。最后,文章讨论了跨模态迁移学习面临的挑战及未来研究方向。 展开更多
关键词 多模态智能 跨模态迁移学习 特征对齐 知识蒸馏 元学习 图像-文本检索 跨语言情感分析
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部