面向卫星在轨处理的强化学习任务调度算法

Reinforcement learning task scheduling algorithm for satellite on-orbit processing

下载PDF

导出

摘要随着卫星对地观测进入多卫星、高分辨率、实时响应、全球观测的时代,卫星在轨数据处理已成为提高遥感数据处理实时性的主流手段之一。在卫星资源受限、数传链路信道资源受限、随遇观测任务具有不可预测性的场景下,进行数据处理任务实时调度具有较大挑战。首先,构建以最大化系统平均数据处理吞吐率为目标的优化问题模型。然后,提出一种在线的结合深度强化学习(deep reinforcement learning,DRL)的任务调度算法,采用DRL算法能够实时计算任务调度策略,选取拉格朗日对偶优化算法能够准确计算最优资源分配量。最后,通过仿真实验对算法有效性和数据处理吞吐率进行评价,结果表明算法能够收敛并接近最优解,相比于已有算法将数据处理吞吐率提高了约8%,且在卫星数据到达速率及卫星计算节点数量增大时具有一定扩展性。所提算法能够在最大化系统平均数据处理吞吐率的同时,保障高动态环境下任务队列长度及平均能耗稳定收敛。 As satellite earth observation enters an era of multiple satellites,high resolution,real-time response,and global observation,satellite on-orbit data processing has become one of the main methods to improve the real-time characteristic of remote sensing data processing.In scenarios where satellite resources are limited,data transmission link channels are constrained,and opportunistic observation tasks are unpredictable,real-time scheduling of data processing tasks faces significant challenges.An optimization problem model with the goal of maximizing the system’s average data processing throughput rate is firstly constructed.Secondly,an online task scheduling algorithm that combines deep reinforcement learning(DRL)is proposed.DRL algorithm enables real-time calculation of task scheduling strategies,and Lagrangian dual optimization algorithm can accurately computes the optimal resource allocation.Finally,simulation experiments are conducted to evaluate the effectiveness and data processing throughput rate of the proposed algorithm.Results show that the proposed algorithm can converge and approach the optimal solution,improving data processing throughput rate by approximately 8%compared to existing algorithms,and demonstrating scalability as the satellite data arrival speed and the number of satellite computing nodes increase.The proposed algorithm can maximize the average data processing throughput rate of the system while ensuring the stability and convergence of task queue length and average energy consumption in a high-dynamic environment.

作者孟麟芝孙小涓胡玉新高斌孙国庆牟文浩 MENG Linzhi;SUN Xiaojuan;HU Yuxin;GAO Bin;SUN Guoqing;MU Wenhao(Aerospace Information Research Institute,Chinese Academy of Sciences,Beijing 100190,China;Key Laboratory of Technology in Geo-spatial Information Processing and Application System,Beijing 100190,China;School of Electronic,Electrical and Communication Engineering,University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区中国科学院空天信息创新研究院中国科学院空间信息处理与应用系统技术重点实验室中国科学院大学电子电气与通信工程学院

出处《系统工程与电子技术》北大核心 2025年第6期1917-1929,共13页 Systems Engineering and Electronics

关键词卫星在轨处理任务调度资源分配深度强化学习李雅普诺夫优化 satellite on-orbit processing task scheduling resource allocation deep reinforcement learning(DRL) Lyapunov optimization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1王龙河,周一青,曹欢,刘子凡,陈岩,陈道进,石晶林.卫星互联网资源管控技术研究[J].中国工程科学,2023,25(6):27-38. 被引量：9
2杨宁,朱其星,伍攀峰,王允森,安剑,孙福磊.星上遥感影像在轨处理进展研究[J].空间电子技术,2023,20(4):1-8. 被引量：7
3Wang Shangguang,Zhang Qiyang,Xing Ruolin,Qi Fei,Xu Mengwei.The First Verification Test of Space-Ground Collaborative Intelligence via Cloud-Native Satellites[J].China Communications,2024,21(4):208-217. 被引量：1
4许斌,赵云凯,朱剑鸣,刘一川,李烜焘,孙雁飞,季一木.移动边缘计算不确定性任务持续卸载及资源分配方法[J].软件学报,2024,35(3):1466-1484. 被引量：12
5付主木,王俊朋,司鹏举,陶发展,于晓升.基于李雅普诺夫随机优化的车辆边缘计算资源管理[J].控制与决策,2022,37(3):721-728. 被引量：7
6许驰,唐紫萱,金曦,夏长清.基于李雅普诺夫优化和深度强化学习的多任务端边迁移[J].控制与决策,2024,39(7):2457-2464. 被引量：5

二级参考文献68

1高昆,刘迎辉,倪国强,张彦.光学遥感图像星上实时处理技术的研究[J].航天返回与遥感,2008,29(1):50-54. 被引量：19
2廖育荣,王斌,蔡洪亮.美国快速响应空间试验分析[J].装备指挥技术学院学报,2010,21(3):54-57. 被引量：13
3毛艺帆,张多林,王路.美国SBIRS-HEO卫星预警能力分析[J].红外技术,2014,36(6):467-470. 被引量：20
4王明伟,韩宇,张波,郝修强.图像压缩算法发展概述[J].空间电子技术,2016,13(2):35-43. 被引量：4
5徐伟,陈彦彤,朴永杰,王绍举.基于吉林一号遥感图像的星载目标快速识别系统[J].光学精密工程,2017,25(1):255-262. 被引量：20
6杨芳,刘思远,赵键,郑清标.新型智能遥感卫星技术展望[J].航天器工程,2017,26(5):74-81. 被引量：29
7周一青,李国杰.未来移动通信系统中的通信与计算融合[J].电信科学,2018,34(3):1-7. 被引量：29
8谢人超,廉晓飞,贾庆民,黄韬,刘韵洁.移动边缘计算卸载技术综述[J].通信学报,2018,39(11):138-155. 被引量：140
9周悦芝,张迪.近端云计算:后云计算时代的机遇与挑战[J].计算机学报,2019,42(4):677-700. 被引量：80
10唐聪,凌永顺(指导),杨华,杨星,路远.基于深度学习的红外与可见光决策级融合检测（英文）[J].红外与激光工程,2019,48(6):446-460. 被引量：17

共引文献35

1李长云,黎建波,徐曦,李亭立.具有能量收集设备的移动边缘计算资源分配研究[J].系统仿真学报,2022,34(11):2313-2322. 被引量：2
2贾泽晗,于子淇,石珵,廖海君,周振宇,孙健,白晖峰,张颉.数字孪生辅助的智慧园区物联终端接入调度方法[J].河北电力技术,2023,42(2):12-19. 被引量：1
3赵璞,肖人彬.基于自组织劳动分工的边云协同任务调度与资源缓存算法[J].控制与决策,2023,38(5):1352-1362. 被引量：6
4李昊,牛海莎,张勇,于政先.基于ConvLSTM神经网络的有杆抽油系统故障诊断研究[J].北京信息科技大学学报（自然科学版）,2023,38(4):53-60. 被引量：1
5罗袁君,白吟蕊,姚永国,孙健.基于低轨卫星互联网的双模通信终端技术[J].天地一体化信息网络,2024,5(2):92-101.
6沈喆,吴川,孙伟琴,刘付龙,张潇.定制医疗器械增材制造的负载均衡进化调度方法[J].医学信息学杂志,2024,45(6):85-91.
7陈剑锋,胡春卉.天地一体网络空间安全变革影响与对策[J].国防科技,2024,45(3):86-92.
8张锐,肖龙龙,张学阳,徐灿.遥感图像判读实验室“教研训考”一体化平台研究[J].实验室研究与探索,2024,43(6):171-178. 被引量：3
9李爽,叶宁,徐康,王甦,王汝传.面向智慧养老的边缘计算卸载方法[J].计算机与现代化,2024(6):95-102.
10侯祥鹏,兰兰,陶长乐,寇小勇,丛佩金,邓庆绪,周俊龙.边缘智能与协同计算:前沿与进展[J].控制与决策,2024,39(7):2385-2404. 被引量：19

1孔建迪.遥感技术在河流水质环境监测中的应用[J].中国资源综合利用,2025,43(5):62-64. 被引量：1
2艾萨克·萨科里克.领导数据驱动型组织[J].经理人,2025(6):52-53.
3张洪杰,范书明,黄雄,孙芳.低碳环保的工程结构检测技术研究[J].低碳世界,2025,15(5):94-96.
4谢承旭,黄钟骏.基于物联网的智慧楼宇照明控制系统设计与节能性能分析[J].工程技术与管理(香港),2025(6):37-39.
5范金凯.探讨环境保护领域中无人机遥感技术的运用[J].中文科技期刊数据库(文摘版)工程技术,2017(2):00256-00256.
6毛严,邹晓蕾,董慧杰.利用卫星微波观测亮温监测东北冷涡移动路径[J].气象科学,2024,44(6):1122-1133.
7吴松华,戴光耀,龙文睿,孙康闻,翟晓春,徐娜,商建,胡秀清,张鹏.风云第三代极轨卫星测风激光雷达仿真与指标分析(特邀)[J].光学学报,2024,44(18):43-55. 被引量：4

系统工程与电子技术

2025年第6期

浏览历史

内容加载中请稍等...

面向卫星在轨处理的强化学习任务调度算法

参考文献6

二级参考文献68

共引文献35

相关作者

相关机构

相关主题

浏览历史