-
题名基于全局语义与局部特征融合的铁路异物侵限检测
- 1
-
-
作者
袁花明
薛云龙
许剑
虞浩凡
-
机构
陕西靖神铁路有限责任公司
西安交通大学信息与通信工程学院
-
出处
《计算机测量与控制》
2026年第1期33-41,50,共10页
-
文摘
针对铁路异物侵限检测中传统方法泛化能力差以及基于深度学习的检测模型存在漏检率和误检率较高的问题,提出了一种全局语义与局部特征融合的铁路异物检测方法;通过解耦处理不同光照条件(白天/夜晚)与摄像头模态(可见光/红外)下的检测任务,结合YOLOv7检测模型与BLIP多模态大模型的语义理解能力,构建了双阈值动态判定策略;采用YOLOv8分割模型精准提取铁轨区域以减少背景干扰;训练适用于不同模态和光照条件的YOLOv7检测模型,并引入低光增强与噪声抑制技术优化夜间检测性能;利用BLIP模型对图像进行语义分析,根据其输出动态调整YOLOv7的检测阈值以平衡漏检率与误检率;经实验测试,在自建铁路异物检测数据集上该方法的mAP达到88.9%,相比基线模型提升0.5%,在真实场景的测试集上误检率和漏检率分别低至1.09%和0.22%;该方法具备良好的实时性与鲁棒性,满足复杂环境下的工程应用需求。
-
关键词
铁轨异物检测
通专结合
YOLOv7
blip模型
双阈值策略
-
Keywords
railway foreign object detection
general-specific combination
YOLOv7
blip model
dual-threshold strategy
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于空天资源信息的视觉问答在战场指挥中的应用
- 2
-
-
作者
苏月怡
邸亮
-
机构
北方信息控制研究院集团有限公司五二八厂
-
出处
《火力与指挥控制》
北大核心
2025年第2期188-196,共9页
-
文摘
随着视觉问答技术的快速发展和广泛应用,视觉问答技术逐渐成熟,将视觉问答引入作战指挥系统的侦察影像情报处理,可利用视觉问答场景图建立,图像中目标之间关联关系建立,自然语言语义对应,答案文本生成等技术,使侦察影像情报资源由单一目标检测识别向战场目标识别、分类,目标间关联关系建立,战场环境理解等方面的能力提升;以视觉问答的方式辅助指挥人员更方便、更快速、更全面地调取和理解侦察影像的情报信息,提高基于空天资源情报信息的使用效率和效果。就提出的一种预训练的视觉-语言理解和生成模型BLIP在军事指挥与辅助决策领域的应用进行了可行性分析,并就视觉问答在军事指挥应用中存在的问题和发展前景进行了探讨。
-
关键词
视觉问答
指挥决策
空天资源信息
blip模型
-
Keywords
visual question answering
command decision-making
aerospace resources information
blip model
-
分类号
TP317.4
[自动化与计算机技术—计算机软件与理论]
-