基于深度学习的视觉目标跟踪研究综述

Review of Visual Object Tracking Based on Deep Learning

导出

摘要目标跟踪是计算机视觉领域的重要研究方向,其任务是在视频序列中对感兴趣的目标进行持续检测与精确定位。随着深度学习技术的迅速发展,视觉目标跟踪在特征建模、时序关联以及端到端学习等方面取得了显著进展。文章系统回顾了基于深度学习的视觉目标跟踪研究现状,从单目标跟踪与多目标跟踪两个方向出发,分析了不同框架下的基本思想与实现机制,阐述了从传统手工特征方法向深度特征驱动模型的演化过程。还总结了常用的跟踪数据集与性能评价指标,并对当前研究面临的主要问题进行了讨论,包括长时间建模能力欠佳、复杂场景跟踪鲁棒性差以及跨场景泛化能力有限等。最后,展望了未来视觉目标跟踪的发展趋势,指出融合多模态信息与时空建模的统一深度框架将成为该领域的重要研究方向。 Object tracking,an important research direction in the field of computer vision,aims to continuously detect and accurately locate objects of interest in video sequences.With the rapid development of deep learning technology,visual object tracking has made significant progress in feature modeling,temporal association,and end-to-end learning.This paper systematically reviews the current research status of deep learning-based visual object tracking and analyzes the fundamental concepts and implementation mechanisms under different frameworks from the perspectives of single object tracking and multi-object tracking.The evolution from traditional hand-crafted feature methods to deep feature-driven models is further elaborated.After summarizing commonly used tracking datasets and performance evaluation metrics,the paper discusses the main challenges in current research,including limited long-term modeling capabilities,weak robustness in complex scene tracking,and poor cross-scene generalization.Finally,future research trends in visual object tracking highlight the development of unified deep framework that integrates multimodal information and spatiotemporal modeling.

作者罗元马文龙唐小平 LUO Yuan;MA Wenlong;TANG Xiaoping(School of Electronic Science and Engineering,Chongqing University of Posts and Telecommunications,Chongqing 40065,CHN)

机构地区重庆邮电大学电子科学与工程学院

出处《半导体光电》北大核心 2026年第1期13-27,共15页 Semiconductor Optoelectronics

基金校企合作项目(E020H2022009)。

关键词深度学习视觉目标跟踪单目标跟踪多目标跟踪 TRANSFORMER deep learning visual target tracking single-object tracking multi-target tracking Transformer

分类号 TP242.6 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1罗元,王薄宇,陈旭.基于深度学习的目标检测技术的研究综述[J].半导体光电,2020,41(1):1-10. 被引量：71
2Chengqun SONG,Fuxiang WU,Xiangyang GAO,Jun CHENG,Mengjie YANG,Qiao LIU,Lei WANG.Open environments-aware SLAM based on YOLO-enhanced open-vocabulary object detection[J].Science China(Technological Sciences),2025,68(11):239-252. 被引量：1

二级参考文献5

1郭毓,苏鹏飞,吴益飞,郭健.基于Faster R-CNN的机器人目标检测及空间定位[J].华中科技大学学报（自然科学版）,2018,46(12):55-59. 被引量：25
2LIU JiaCheng,MENG ZiYang,YOU Zheng.A robust visual SLAM system in dynamic man-made environments[J].Science China(Technological Sciences),2020,63(9):1628-1636. 被引量：6
3LI Bin,SHANG Yang,GUAN BangLei,LIANG ShunKun,SUN XiaoLiang,YU QiFeng.Multiple rotation averaging using only the relative rotation angle[J].Science China(Technological Sciences),2023,66(10):2978-2985. 被引量：1
4REN KeYan,YAN Tong,HU ZhaoXin,HAN HongGui,ZHANG YunLu.Image attention transformer network for indoor 3D object detection[J].Science China(Technological Sciences),2024,67(7):2176-2190. 被引量：3
5李国杰.智能计算技术的历史性突破与巨大挑战[J].集成技术,2025,14(1):1-8. 被引量：3

共引文献70

1王菲菲,陈磊,焦良葆,曹雪虹.基于SSD-MobileNet的安全帽检测算法研究[J].信息化研究,2020(3):34-39. 被引量：2
2李凯,邓杰荣,张鑫,李勇博,习雨璇,李淄博,曹喜信.基于人工智能的大篆字体识别系统研究与验证[J].微纳电子与智能制造,2020,2(1):122-126. 被引量：2
3黄家才,邹俊,丁凌,陈田.基于改进YOLO v3算法的零件目标快速检测方法[J].南京工程学院学报（自然科学版）,2020,18(3):6-11. 被引量：5
4李兰.机器视觉技术在工业机器人的应用研究[J].今日自动化,2020(4):42-44.
5刘晓音,谢红.基于深度学习的人体胸腰部检测[J].纺织导报,2020(11):76-78. 被引量：1
6黄鸣宇,吴丽梅,邝晓东,彭伟清.CT图像增强辅助诊断系统在椎间盘突出诊断中的应用研究[J].中国医学装备,2020,17(12):44-48. 被引量：9
7叶保璇,王康坚,余盛达,易婷婷,黄廷城.基于边-云协同的输电线路综合在线监测系统[J].机电工程技术,2020,49(11):73-75. 被引量：3
8罗元,肖航,欧俊雄.基于深度学习的目标跟踪技术的研究综述[J].半导体光电,2020,41(6):757-767. 被引量：20
9朱旭淏.基于YOLO网络模型的行人检测研究[J].数码设计,2021,10(3):33-33.
10蒋先平,徐灿,刘丰溥,吴玉发,薛坤鹏.果蔬采摘机器人系统的应用与发展[J].现代农业装备,2021,42(2):2-8. 被引量：11

1曹雯,范冰,徐铭铭,景力涛,李德军,汤文俊.基于CNN-LSTM-CMA-GRU的多尺度中期负荷预测方法[J].电力需求侧管理,2026,28(2):57-63.
2燕荣坤,李成龙,黄文魁.大数据挖掘技术在电气仪表故障智能诊断中的应用[J].电气技术与经济,2026(3):116-119.
3李武学,张天贺,赵兴华,许长宝,魏海洋,张子旭.基于机器学习算法构建前列腺癌早期诊断的风险预测模型[J].现代泌尿外科杂志,2026,31(3):249-257.
4张英朝,王艺霖,王国华,贾宇涵.基于数字孪生的环境风洞试验场景研究[J].湖南大学学报(自然科学版),2026,53(2):136-145.
5刘胜军.基于拉压疲劳试验的保通路面沥青混合料性能研究[J].铁道建筑技术,2026(2):105-108.

半导体光电

2026年第1期

浏览历史

内容加载中请稍等...

基于深度学习的视觉目标跟踪研究综述

参考文献2

二级参考文献5

共引文献70

相关作者

相关机构

相关主题

浏览历史