期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Chinese-CLIP模型和Prompt提示机制的图文检索方法
被引量:
1
1
作者
陈道彬
张子诺
+2 位作者
付裕彬
黎晋铭
林彬
《现代信息科技》
2025年第6期130-134,共5页
为提升图像文本匹配任务的准确率,提出了一种基于Chinese-CLIP模型和Prompt提示机制的图文检索方法。一方面,对文本数据进行预处理,去除停用词和标点符号后,利用BERT模型提取文本特征;另一方面,使用卷积神经网络提取图像特征,并将得到...
为提升图像文本匹配任务的准确率,提出了一种基于Chinese-CLIP模型和Prompt提示机制的图文检索方法。一方面,对文本数据进行预处理,去除停用词和标点符号后,利用BERT模型提取文本特征;另一方面,使用卷积神经网络提取图像特征,并将得到的文本与图像特征进行序列化,以实现多模态特征融合。模型训练时,先使用Chinese-CLIP大模型进行初步训练,再引入Prompt提示机制对模型进行微调。实验结果表明,所提方法在文搜图和图搜文两个任务上均有效地提升了准确率与召回率。
展开更多
关键词
图文检索
多模态特征融合
chinese-clip
模型
Prompt提示机制
在线阅读
下载PDF
职称材料
基于Chinese-CLIP+DeepSeek的铁路旅客遗失物品管理系统设计
2
作者
柳调红
唐伟忠
+2 位作者
赵仲瑜
孟超
张文辉
《铁路计算机应用》
2025年第6期78-87,共10页
针对铁路旅客遗失物品管理业务效率低、人工匹配查找工作量繁重等问题,文章设计了基于Chinese-CLIP+DeepSeek的铁路旅客遗失物品管理系统,借助Chinese-CLIP模型的跨模态表示学习能力,对遗失物品图像和文本描述进行联合表征,实现跨模态...
针对铁路旅客遗失物品管理业务效率低、人工匹配查找工作量繁重等问题,文章设计了基于Chinese-CLIP+DeepSeek的铁路旅客遗失物品管理系统,借助Chinese-CLIP模型的跨模态表示学习能力,对遗失物品图像和文本描述进行联合表征,实现跨模态语义对齐;同时结合DeepSeek大语言模型的自然语言理解能力,构建智能客服机器人,优化旅客遗失物品申报和查询的人机交互,支持上传遗失物品图像,提高物品信息采集的准确性、完整性和规范性,并基于多模态融合与向量检索的遗失物品匹配技术,实现跨模态高效匹配。该系统为铁路旅客遗失物品管理提供了智能化解决方案,也为人工智能(AI,Artificial Intelligence)技术在铁路行业应用实践提供了参考。
展开更多
关键词
铁路旅客遗失物品管理
图文检索
chinese-clip
客服机器人
自然语言处理
DeepSeek
在线阅读
下载PDF
职称材料
基于CHINESE-CLIP跨模态图像文本检索研究
被引量:
2
3
作者
聂葳
叶成炜
+5 位作者
杨家慧
哈雯
段班祥
桂改花
苑占江
黄海锋
《电子制作》
2024年第22期61-66,共6页
本文聚焦于多模态图像语义关联问题,采用CHINESE-CLIP模型结合迁移学习技术,探索了基于文本的图像检索和基于图像的文本检索两种方法。研究采用了CHINESE-CLIP多模态预训练神经网络,通过融合文本和图像特征提取技术,实现了文本与图像在...
本文聚焦于多模态图像语义关联问题,采用CHINESE-CLIP模型结合迁移学习技术,探索了基于文本的图像检索和基于图像的文本检索两种方法。研究采用了CHINESE-CLIP多模态预训练神经网络,通过融合文本和图像特征提取技术,实现了文本与图像在统一空间内的高效匹配。在图像检索文本的任务中,对比了CN-CLIPViT-B/16和CN-CLIPViT-L/14两种模型的性能,结果表明CN-CLIPViT-L/14模型在语义关联上表现更为优异。在基于图像的文本检索方面,模型利用Vision Transformer(ViT)图像编码器和对比损失进行训练。ViT通过将图像分割成固定大小的图块,采用自注意力机制处理序列元素,并通过前馈网络进一步提取特征,最终实现图文互检的能力。最终,图文检索模型在图像检索文本的准确率:R1为76.56%,R5为94.17%,R10为97.48%;在文本检索图像的准确率:R1为70.73%,R5为94.80%,R10为97.25%。
展开更多
关键词
chinese-clip
多模态预训练神经网络
CN-CLIPViT-L/14
Vision
Transformer(ViT)
在线阅读
下载PDF
职称材料
题名
基于Chinese-CLIP模型和Prompt提示机制的图文检索方法
被引量:
1
1
作者
陈道彬
张子诺
付裕彬
黎晋铭
林彬
机构
桂林理工大学数学与统计学院
应用统计广西高校重点实验室
出处
《现代信息科技》
2025年第6期130-134,共5页
基金
广西自然科学基金项目(2019GXNSFBA245056)
大学生创新创业训练计划项目(202410596733,202410596731)。
文摘
为提升图像文本匹配任务的准确率,提出了一种基于Chinese-CLIP模型和Prompt提示机制的图文检索方法。一方面,对文本数据进行预处理,去除停用词和标点符号后,利用BERT模型提取文本特征;另一方面,使用卷积神经网络提取图像特征,并将得到的文本与图像特征进行序列化,以实现多模态特征融合。模型训练时,先使用Chinese-CLIP大模型进行初步训练,再引入Prompt提示机制对模型进行微调。实验结果表明,所提方法在文搜图和图搜文两个任务上均有效地提升了准确率与召回率。
关键词
图文检索
多模态特征融合
chinese-clip
模型
Prompt提示机制
Keywords
image-text retrieval
multi-modal feature fusion
chinese-clip
model
Prompt mechanism
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于Chinese-CLIP+DeepSeek的铁路旅客遗失物品管理系统设计
2
作者
柳调红
唐伟忠
赵仲瑜
孟超
张文辉
机构
中国铁路兰州局集团有限公司信息技术所
出处
《铁路计算机应用》
2025年第6期78-87,共10页
基金
中国国家铁路集团有限公司科研研究开发计划(P2024S001)
中国铁路兰州局集团公司科技研究计划(2025094-1)。
文摘
针对铁路旅客遗失物品管理业务效率低、人工匹配查找工作量繁重等问题,文章设计了基于Chinese-CLIP+DeepSeek的铁路旅客遗失物品管理系统,借助Chinese-CLIP模型的跨模态表示学习能力,对遗失物品图像和文本描述进行联合表征,实现跨模态语义对齐;同时结合DeepSeek大语言模型的自然语言理解能力,构建智能客服机器人,优化旅客遗失物品申报和查询的人机交互,支持上传遗失物品图像,提高物品信息采集的准确性、完整性和规范性,并基于多模态融合与向量检索的遗失物品匹配技术,实现跨模态高效匹配。该系统为铁路旅客遗失物品管理提供了智能化解决方案,也为人工智能(AI,Artificial Intelligence)技术在铁路行业应用实践提供了参考。
关键词
铁路旅客遗失物品管理
图文检索
chinese-clip
客服机器人
自然语言处理
DeepSeek
Keywords
railway passenger lost item management system
chinese-clip
image and text retrieval
customer service robot
natural language processing
DeepSeek
分类号
U293.22 [交通运输工程—交通运输规划与管理]
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于CHINESE-CLIP跨模态图像文本检索研究
被引量:
2
3
作者
聂葳
叶成炜
杨家慧
哈雯
段班祥
桂改花
苑占江
黄海锋
机构
广东科学技术职业学院计算机工程技术学院(人工智能学院)
出处
《电子制作》
2024年第22期61-66,共6页
基金
2024年广东省普通高校青年创新人才项目(编号:2024KQNCX295)
基于昇腾NPU的无人机电力线路巡检图像缺陷识别算法研究及实现(编号:2021ZDZX3029)
+4 种基金
广东省继续教育质量提升工程(编号:JXJYGC2022GX111)
2022年计算机视觉应用创新团队(编号:2022KCXTD047)
2023年广东省普通高校青年创新人才项目(编号:2023KQNCX185)
广东省普通高校特色创新项目非马氏细胞内部随机过程的建模与分析(编号:2020KTSCX238)
广东省智慧职教工程技术研究中心(编号:2021A118)。
文摘
本文聚焦于多模态图像语义关联问题,采用CHINESE-CLIP模型结合迁移学习技术,探索了基于文本的图像检索和基于图像的文本检索两种方法。研究采用了CHINESE-CLIP多模态预训练神经网络,通过融合文本和图像特征提取技术,实现了文本与图像在统一空间内的高效匹配。在图像检索文本的任务中,对比了CN-CLIPViT-B/16和CN-CLIPViT-L/14两种模型的性能,结果表明CN-CLIPViT-L/14模型在语义关联上表现更为优异。在基于图像的文本检索方面,模型利用Vision Transformer(ViT)图像编码器和对比损失进行训练。ViT通过将图像分割成固定大小的图块,采用自注意力机制处理序列元素,并通过前馈网络进一步提取特征,最终实现图文互检的能力。最终,图文检索模型在图像检索文本的准确率:R1为76.56%,R5为94.17%,R10为97.48%;在文本检索图像的准确率:R1为70.73%,R5为94.80%,R10为97.25%。
关键词
chinese-clip
多模态预训练神经网络
CN-CLIPViT-L/14
Vision
Transformer(ViT)
分类号
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Chinese-CLIP模型和Prompt提示机制的图文检索方法
陈道彬
张子诺
付裕彬
黎晋铭
林彬
《现代信息科技》
2025
1
在线阅读
下载PDF
职称材料
2
基于Chinese-CLIP+DeepSeek的铁路旅客遗失物品管理系统设计
柳调红
唐伟忠
赵仲瑜
孟超
张文辉
《铁路计算机应用》
2025
0
在线阅读
下载PDF
职称材料
3
基于CHINESE-CLIP跨模态图像文本检索研究
聂葳
叶成炜
杨家慧
哈雯
段班祥
桂改花
苑占江
黄海锋
《电子制作》
2024
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部