-
题名基于多视角信息的行人检测算法
- 1
-
-
作者
刘皓宇
孔鹏伟
王耀力
常青
-
机构
太原理工大学集成电路学院
山西伟涛食品科技股份有限公司
太原理工大学电子信息工程学院
-
出处
《计算机应用》
北大核心
2025年第7期2325-2332,共8页
-
基金
山西省重点研发计划项目(201903D321003)
企业委托开发项目(RH2400001203)。
-
文摘
针对现有的多视角行人检测算法中因目标遮挡严重以及未关注多视角之间关系而导致的错检和漏检等问题,提出一种基于MVDeTr(MultiView Detection with shadow Transformer)算法改进的多视角行人检测算法。首先,在特征提取阶段,设计一个视角特征增强模块VEM(View Enhancement Module),通过关注不同视角之间的关系实现对重要视角的增强;其次,在将多视角信息引入单视角的过程中,加入高效多尺度注意力(EMA)模块建立短距离和长距离依赖关系,从而提升检测效果;最后,在原始基线算法Shadow Transformer模块的基础上,设计一种新的多视角信息处理模块EST(Efficient Shadow Transformer),在保持检测效果的基础上减少多视角中冗余信息的使用。实验结果表明,在Wildtrack数据集上与原始MVDeTr算法相比,所提算法的主要检测指标MODA(Multiple Object Detection Accuracy)提升了1.8个百分点,检测指标MODP(Multiple Object Detection Precision)提升了0.6个百分点,召回率提升了1.8个百分点。可见,所提算法能很好地应用于多视角行人检测任务。
-
关键词
多视角
行人检测
mvdetr
注意力机制
特征增强
-
Keywords
multi-view
pedestrian detection
mvdetr(MultiView Detection with shadow Transformer)
attention mechanism
feature enhancement
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP391.4
[自动化与计算机技术—计算机应用技术]
-