期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Chinese-CLIP模型和Prompt提示机制的图文检索方法 被引量:1
1
作者 陈道彬 张子诺 +2 位作者 付裕彬 黎晋铭 林彬 《现代信息科技》 2025年第6期130-134,共5页
为提升图像文本匹配任务的准确率,提出了一种基于Chinese-CLIP模型和Prompt提示机制的图文检索方法。一方面,对文本数据进行预处理,去除停用词和标点符号后,利用BERT模型提取文本特征;另一方面,使用卷积神经网络提取图像特征,并将得到... 为提升图像文本匹配任务的准确率,提出了一种基于Chinese-CLIP模型和Prompt提示机制的图文检索方法。一方面,对文本数据进行预处理,去除停用词和标点符号后,利用BERT模型提取文本特征;另一方面,使用卷积神经网络提取图像特征,并将得到的文本与图像特征进行序列化,以实现多模态特征融合。模型训练时,先使用Chinese-CLIP大模型进行初步训练,再引入Prompt提示机制对模型进行微调。实验结果表明,所提方法在文搜图和图搜文两个任务上均有效地提升了准确率与召回率。 展开更多
关键词 图文检索 多模态特征融合 chinese-clip模型 Prompt提示机制
在线阅读 下载PDF
基于Chinese-CLIP+DeepSeek的铁路旅客遗失物品管理系统设计
2
作者 柳调红 唐伟忠 +2 位作者 赵仲瑜 孟超 张文辉 《铁路计算机应用》 2025年第6期78-87,共10页
针对铁路旅客遗失物品管理业务效率低、人工匹配查找工作量繁重等问题,文章设计了基于Chinese-CLIP+DeepSeek的铁路旅客遗失物品管理系统,借助Chinese-CLIP模型的跨模态表示学习能力,对遗失物品图像和文本描述进行联合表征,实现跨模态... 针对铁路旅客遗失物品管理业务效率低、人工匹配查找工作量繁重等问题,文章设计了基于Chinese-CLIP+DeepSeek的铁路旅客遗失物品管理系统,借助Chinese-CLIP模型的跨模态表示学习能力,对遗失物品图像和文本描述进行联合表征,实现跨模态语义对齐;同时结合DeepSeek大语言模型的自然语言理解能力,构建智能客服机器人,优化旅客遗失物品申报和查询的人机交互,支持上传遗失物品图像,提高物品信息采集的准确性、完整性和规范性,并基于多模态融合与向量检索的遗失物品匹配技术,实现跨模态高效匹配。该系统为铁路旅客遗失物品管理提供了智能化解决方案,也为人工智能(AI,Artificial Intelligence)技术在铁路行业应用实践提供了参考。 展开更多
关键词 铁路旅客遗失物品管理 图文检索 chinese-clip 客服机器人 自然语言处理 DeepSeek
在线阅读 下载PDF
基于CHINESE-CLIP跨模态图像文本检索研究 被引量:2
3
作者 聂葳 叶成炜 +5 位作者 杨家慧 哈雯 段班祥 桂改花 苑占江 黄海锋 《电子制作》 2024年第22期61-66,共6页
本文聚焦于多模态图像语义关联问题,采用CHINESE-CLIP模型结合迁移学习技术,探索了基于文本的图像检索和基于图像的文本检索两种方法。研究采用了CHINESE-CLIP多模态预训练神经网络,通过融合文本和图像特征提取技术,实现了文本与图像在... 本文聚焦于多模态图像语义关联问题,采用CHINESE-CLIP模型结合迁移学习技术,探索了基于文本的图像检索和基于图像的文本检索两种方法。研究采用了CHINESE-CLIP多模态预训练神经网络,通过融合文本和图像特征提取技术,实现了文本与图像在统一空间内的高效匹配。在图像检索文本的任务中,对比了CN-CLIPViT-B/16和CN-CLIPViT-L/14两种模型的性能,结果表明CN-CLIPViT-L/14模型在语义关联上表现更为优异。在基于图像的文本检索方面,模型利用Vision Transformer(ViT)图像编码器和对比损失进行训练。ViT通过将图像分割成固定大小的图块,采用自注意力机制处理序列元素,并通过前馈网络进一步提取特征,最终实现图文互检的能力。最终,图文检索模型在图像检索文本的准确率:R1为76.56%,R5为94.17%,R10为97.48%;在文本检索图像的准确率:R1为70.73%,R5为94.80%,R10为97.25%。 展开更多
关键词 chinese-clip多模态预训练神经网络 CN-CLIPViT-L/14 Vision Transformer(ViT)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部