-
题名一种基于交叉注意力机制的跨模态视频-文本检索模型
- 1
-
-
作者
王盛
宋向辉
胡世雄
梁营力
孙晓亮
-
机构
信息工程大学
交通运输部公路科学研究院
黄河交通学院
河南省中工设计研究院集团有限公司
北京中交国通智能交通系统技术有限公司
-
出处
《安全、健康和环境》
2025年第3期20-26,共7页
-
基金
国家自然科学基金(面上项目)(62272480),黑灰产网络资产图谱可视分析关键技术研究。
-
文摘
在危险品运输的安全规划任务中,准确识别交通事故诱因至关重要。现有方法通常依赖交通事故报告、交通监控视频和其他文本数据的结合分析,但存在跨模态数据检索精度和效率不高的问题。为此,提出了一种基于交叉注意力机制的跨模态检索模型,旨在提升危险品运输事故分析过程中的跨模态数据检索性能。该模型通过融合交通监控视频与事故报告等文本数据,利用交叉注意力机制有效地提取视频-文本之间的对应关系,以提高检索的准确性与效率。模型架构包括数据预处理、特征提取、交叉注意力机制、多模态特征融合、精细化相似度计算和优化损失函数。实验结果表明,提出的模型所有评估指标都超越了基准模型,如在Recall@5上超过了基准模型(HiT)2.53%,显著优于对比语言-图像预训练(CLIP)等现有跨模态数据检索方法,消融实验进一步验证了交叉注意力机制在提高检索精度和效率中的关键作用。该研究为危险品运输的安全规划与事故预防提供了有力支持。
-
关键词
危险品运输
跨模态检索
交通监控
交叉注意力机制
事故分析
任务规划
-
Keywords
dangerous goods transportation
cross-modal retrieval
traffic surveillance
cross-attention mechanism
accident analyze
route planning
-
分类号
TP181.5
[自动化与计算机技术—控制理论与控制工程]
-