-
题名引入经验加权回放机制的MATD3改进算法
- 1
-
-
作者
蒙贤哲
张国
王华川
-
机构
海军大连舰艇学院水面舰艇作战实验中心
哈尔滨工程大学智能科学与工程学院
-
出处
《指挥信息系统与技术》
2025年第3期21-27,共7页
-
基金
国家社会科学基金重大项目(24&ZD288)
国家自然科学基金(72471104)资助项目。
-
文摘
在多智能体强化学习领域,多智能体系统样本利用效率低,多智能体双延迟深度确定性策略梯度(MATD3)算法收敛慢且鲁棒性差。针对上述问题,创新地将经验加权回放(EWR)机制融入MATD3算法。通过剖析相关原理,阐释了该机制提升算法性能的逻辑,并设计出融合后的算法MATD3-EWR。案例分析表明,与经典的MATD3算法相比,改进后的MATD3-EWR算法在多机器人协作场景中训练迭代次数减少了50%,决策准确率从70%提升至85%,且环境扰动下的性能波动标准差从0.08降至0.03,从而提高了稳定性。该算法为多智能体系统在复杂环境中的应用提供有力支持。
-
关键词
多智能体系统
多智能体双延迟深度确定性策略梯度(matd3)算法
经验加权回放(EWR)机制
训练效率
稳定性
-
Keywords
multi-agent system
multi-agent twin delayed deep deterministic policy gradient(matd3)algorithm
experience-weighted replay(EWR)mechanism
training efficiency
stability
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名M-DRL的低轨道卫星网络计算卸载和任务迁移
被引量:1
- 2
-
-
作者
徐飞
宁辛
安朔
申奥祥
王泽轩
-
机构
西安工业大学计算机科学与工程学院
-
出处
《西安工业大学学报》
CAS
2024年第3期395-404,共10页
-
基金
咸阳市科技局重点研发项目(2021ZDYF-NY-0019)。
-
文摘
针对无人机网络高时延、低性能、有限带宽、难以解决复杂计算任务问题,提出了一种将低地球轨道卫星和移动边缘计算技术结合形成的MEC辅助LEO卫星网络计算卸载和任务迁移方法。首先通过建立本地计算模型、卸载模型和迁移模型,确定目标优化成本函数。然后为降低模型复杂度,引入多智能体深度强化学习模型,利用多智能体双延迟深度确定性策略梯度(MATD3)算法求解优化问题,降低系统总时延。仿真结果表明,与本地计算及随机迁移算法相比,MATD3算法的任务处理时延分别降低94.55%和83.02%,证明了MATD3算法在计算卸载和任务迁移方面的有效性和可靠性。
-
关键词
LEO卫星网络
移动边缘计算
matd3算法
计算卸载
卫星通信
-
Keywords
LEO satellite network
mobile edge computing
matd3 algorithm
computing offloading
satellite communications
-
分类号
TN927.2
[电子电信—通信与信息系统]
-