基于周期一致性和动态记忆增强的无监督无人机目标跟踪

Unsupervised cycle-consistent learning with dynamic memory-augmented for unmanned aerial vehicle videos tracking

下载PDF

导出

摘要针对无人机(UAV)视频数据集采集成本高,现有数据普遍存在规模有限、应用场景单一,且现有无监督目标跟踪方法通常只用于通用数据集设计,对UAV的复杂场景难以学习可靠信息等问题,提出一种无监督UAV目标跟踪模型,其基于时间周期一致性与动态记忆增强。首先,将显著性目标检测引入无标签的对象发现,并与无监督光流技术结合,引入基于图像熵的动态规划,提高伪标签的质量。其次,为视频中的每一帧定义权重,并利用这些权重进行单帧训练,以更全面地利用每一帧的信息。最后,借鉴长短期记忆网络的思想,将记忆队列转变为动态记忆队列。设计自注意力分支且作为记忆队列的门控机制,并控制队列的记忆与遗忘,在不增加队列长度的同时,实现长跨度下的目标特征变化学习。该方法在UAV数据集上的准确率达到了68%,领先于其他无监督跟踪器,与一般有监督跟踪器的性能持平。在一般场景数据集上也与其他无监督跟踪器性能近似,准确率达到77%。在UAV数据集和一般场景数据集上的实验结果表明,其在快速运动和大尺度变化场景性能方面有较好提高。 The collection of UAV(unmanned aerial vehicle)video datasets is costly and faces issues such as limited quantity,low quality,and scenario constraints.To address these challenges,an unsupervised UAV-object-tracking model based on temporal cycle consistency and dynamic memory enhancement was proposed.First,salient-object detection was introduced for unlabeled object discovery.By combining salient object detection with unsupervised optical flow techniques and incorporating dynamic programming based on image entropy,the quality of pseudo-labels was improved.Second,a weight is defined for each frame in the video,and these weights are utilized for single-frame training to fully leverage the information from all frames.Finally,inspired by long short-term memory(LSTM)networks,the memory queue was transformed into a dynamic memory queue,along with a self-attention branch designed to control its updates.Target-features changes over long spans were learned without increasing the queue length.The proposed method achieved 68%accuracy on UAV datasets,outperforming other unsupervised trackers and matching typical supervised-tracker performance.On general scene datasets,it attained 77%accuracy,comparable to other unsupervised trackers.Experimental results on both UAV and general scene datasets demonstrated that the proposed method achieved excellent performance in scenarios involving rapid motion and large-scale variations.

作者肖凯袁玲储珺 XIAO Kai;YUAN Ling;CHU Jun(Jiangxi Provincial Key Laboratory of Image Processing and Pattern Recognition,Nanchang Hangkong University,Nanchang Jiangxi 330063,China;School of Software Engineering,Nanchang Hangkong University,Nanchang Jiangxi 330063,China)

机构地区南昌航空大学图像处理与模式识别江西省重点实验室南昌航空大学软件学院

出处《图学学报》北大核心 2025年第6期1281-1291,共11页 Journal of Graphics

基金江西省研究生创新专项(YC2023-S747)。

关键词目标跟踪无人机无监督学习注意力机制孪生网络 object tracking unmanned aerial vehicle unsupervised learning attention mechanism twin network

分类号 V279 [航空宇航科学与技术—飞行器设计] TP39.411 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1王三泉,王璐,储珺,黄斌.基于未知类别少样本学习的开放世界目标定位[J].南昌航空大学学报（自然科学版）,2024,38(3):33-44. 被引量：1
2程旭东,史彩娟,高炜翔,王森,段昌钰,闫晓东.面向域自适应目标检测的一致无偏教师模型[J].图学学报,2025,46(1):114-125. 被引量：2
3蔡嘉诚,董方敏,孙水发,汤永恒.无监督单目深度估计研究综述[J].计算机科学,2024,51(2):117-134. 被引量：4
4王文鹏,秦寅畅,师文轩.工业缺陷检测无监督深度学习方法综述[J].计算机应用,2025,45(5):1658-1670. 被引量：7
5冯尊登,王洪元,林龙,孙博言,陈海琴.基于多分支注意网络与相似度学习策略的无监督行人重识别[J].图学学报,2023,44(2):280-290. 被引量：2
6郑晗,储珺.目标检测中的特征融合方法[J].南昌航空大学学报（自然科学版）,2022,36(4):59-67. 被引量：5
7储珺,林文杰,徐鹏.目标检测中特征不匹配问题研究进展[J].南昌航空大学学报（自然科学版）,2021,35(3):1-8. 被引量：4

二级参考文献28

1储珺,林文杰,徐鹏.目标检测中特征不匹配问题研究进展[J].南昌航空大学学报（自然科学版）,2021,35(3):1-8. 被引量：4
2周东华,魏慕恒,司小胜.工业过程异常检测、寿命预测与维修决策的研究进展[J].自动化学报,2013,39(6):711-722. 被引量：97
3刘天亮,莫一鸣,徐高帮,戴修斌,朱秀昌,罗杰波.多线索非参数化融合的单目视频深度估计[J].东南大学学报（自然科学版）,2015,45(5):834-839. 被引量：2
4丁宗元,王洪元,陈付华,倪彤光.基于距离中心化与投影向量学习的行人重识别[J].计算机研究与发展,2017,54(8):1785-1794. 被引量：19
5戴臣超,王洪元,倪彤光,陈首兵.基于深度卷积生成对抗网络和拓展近邻重排序的行人重识别[J].计算机研究与发展,2019,56(8):1632-1641. 被引量：29
6戴仁月,方志军,高永彬.融合扩张卷积网络与SLAM的无监督单目深度估计[J].激光与光电子学进展,2020,57(6):106-114. 被引量：9
7周云成,邓寒冰,许童羽,苗腾,吴琼.基于稠密自编码器的无监督番茄植株图像深度估计模型[J].农业工程学报,2020,36(11):182-192. 被引量：10
8曹亮,王洪元,戴臣超,陈莉,刘乾.基于多样性约束和离散度分层聚类的无监督视频行人重识别[J].南京航空航天大学学报,2020,52(5):752-759. 被引量：6
9王粉花,赵波,黄超,严由齐.基于多尺度和注意力融合学习的行人重识别[J].电子与信息学报,2020,42(12):3045-3052. 被引量：10
10张宝华,朱思雨,吕晓琪,谷宇,王月明,刘新,任彦,李建军,张明.软多标签和深度特征融合的无监督行人重识别[J].光电工程,2020,47(12):13-22. 被引量：7

共引文献17

1陈英,林洪平,张伟,冯龙锋,郑铖,周滔辉,易珍,刘岚.医学图像数据集扩充方法研究进展[J].生物医学工程学杂志,2023,40(1):185-192. 被引量：5
2陈英,张伟,林洪平,郑铖,周滔辉,冯龙锋,易珍(综述),刘岚(审校).医学图像分割算法的损失函数综述[J].生物医学工程学杂志,2023,40(2):392-400. 被引量：13
3于吉锴,黄真亮,江乐旗,葛利跃,张聪炫.基于差分卷积和深浅层特征融合的表面缺陷分割[J].失效分析与预防,2024,19(3):149-157. 被引量：1
4王三泉,王璐,储珺,黄斌.基于未知类别少样本学习的开放世界目标定位[J].南昌航空大学学报（自然科学版）,2024,38(3):33-44. 被引量：1
5曹明伟,邢景杰,程宜风,赵海锋.LpDepth:基于拉普拉斯金字塔的自监督单目深度估计[J].计算机科学,2025,52(3):33-40.
6陶海波,冯瑞娜,阙启正,储珺.复杂背景大尺度变化的无人机目标跟踪[J].南昌航空大学学报(自然科学版),2025,39(1):39-49. 被引量：1
7张祺,常学森,王超,白舸.图像处理的特点及发展趋势[J].计算机时代,2025(5):12-18.
8郝旭,武文红,牛恒茂,石宝,乌尼尔,王嘉敏,褚宏坤.施工现场的人机距离检测方法综述[J].计算机科学,2025,52(S1):359-368.
9凌非,余京涛,朱哲燕,罗剑,朱继祥,陈先客,董建锋.基于对比学习的数据高效视频检索[J].图学学报,2025,46(3):491-501. 被引量：1
10何正,董振华,崔杰,陈洁,郝蒙娜.基于树莓派和YOLOv5的番茄植株健康检测系统[J].物联网技术,2025,15(14):11-14.

1黄昱程,肖子旺,武丹凤,艾斯卡尔·艾木都拉.时空融合与判别力增强的孪生网络目标跟踪方法[J].智能系统学报,2024,19(5):1218-1227. 被引量：2
2范晓鹏,彭力,杨杰龙.基于隐空间匹配的无监督目标漂移校正及跟踪[J].计算机科学,2024,51(11):166-173. 被引量：1
3刘东润,宋程,刘子豪,崔海涛,丁帅.数字医疗领域生理心理智能感知技术发展路径研究[J].中国工程科学,2025,27(6):44-53.
4林叶贵,吴昊,邢科新,何德峰.基于QR码的移动机器人图像自动曝光和识别算法研究[J].高技术通讯,2025,35(10):1100-1107.
5郭栋.国际地震救援信息搜集路径探索[J].中国应急救援,2025(6):27-31.
6包姣,肖粲俊,石发强,王晨宇,杨竣翔.基于PP-OCRv3迁移学习的煤矿数字显示器字符识别研究[J].煤矿安全,2025,56(12):239-248.
7李嵩伟.基于视觉传达原理的激光图像拼接研究[J].激光杂志,2025,46(11):195-200.
8彭鹏霏,燕玉林,仲训昱,王宁宁.地面式全景激光扫描仪设计及其标定与数据融合方法[J].计算机工程与应用,2025,61(24):206-215.
9杨柳笑,曾旸,元志安,刘威,邓彬,王宏强.基于ADMM的空间目标太赫兹ISAR图像重建算法[J].现代雷达,2025,47(11):58-65.
10王佳凯,邓科,刘芳,邹伟伟.基于改进RANSAC算法的挂点点云分割方法[J].兵器装备工程学报,2025,46(12):290-296.

图学学报

2025年第6期

浏览历史

内容加载中请稍等...

基于周期一致性和动态记忆增强的无监督无人机目标跟踪

参考文献7

二级参考文献28

共引文献17

相关作者

相关机构

相关主题

浏览历史