期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
引入经验加权回放机制的MATD3改进算法
1
作者 蒙贤哲 张国 王华川 《指挥信息系统与技术》 2025年第3期21-27,共7页
在多智能体强化学习领域,多智能体系统样本利用效率低,多智能体双延迟深度确定性策略梯度(MATD3)算法收敛慢且鲁棒性差。针对上述问题,创新地将经验加权回放(EWR)机制融入MATD3算法。通过剖析相关原理,阐释了该机制提升算法性能的逻辑,... 在多智能体强化学习领域,多智能体系统样本利用效率低,多智能体双延迟深度确定性策略梯度(MATD3)算法收敛慢且鲁棒性差。针对上述问题,创新地将经验加权回放(EWR)机制融入MATD3算法。通过剖析相关原理,阐释了该机制提升算法性能的逻辑,并设计出融合后的算法MATD3-EWR。案例分析表明,与经典的MATD3算法相比,改进后的MATD3-EWR算法在多机器人协作场景中训练迭代次数减少了50%,决策准确率从70%提升至85%,且环境扰动下的性能波动标准差从0.08降至0.03,从而提高了稳定性。该算法为多智能体系统在复杂环境中的应用提供有力支持。 展开更多
关键词 多智能体系统 多智能体双延迟深度确定性策略梯度(matd3)算法 经验加权回放(EWR)机制 训练效率 稳定性
在线阅读 下载PDF
M-DRL的低轨道卫星网络计算卸载和任务迁移 被引量:1
2
作者 徐飞 宁辛 +2 位作者 安朔 申奥祥 王泽轩 《西安工业大学学报》 CAS 2024年第3期395-404,共10页
针对无人机网络高时延、低性能、有限带宽、难以解决复杂计算任务问题,提出了一种将低地球轨道卫星和移动边缘计算技术结合形成的MEC辅助LEO卫星网络计算卸载和任务迁移方法。首先通过建立本地计算模型、卸载模型和迁移模型,确定目标优... 针对无人机网络高时延、低性能、有限带宽、难以解决复杂计算任务问题,提出了一种将低地球轨道卫星和移动边缘计算技术结合形成的MEC辅助LEO卫星网络计算卸载和任务迁移方法。首先通过建立本地计算模型、卸载模型和迁移模型,确定目标优化成本函数。然后为降低模型复杂度,引入多智能体深度强化学习模型,利用多智能体双延迟深度确定性策略梯度(MATD3)算法求解优化问题,降低系统总时延。仿真结果表明,与本地计算及随机迁移算法相比,MATD3算法的任务处理时延分别降低94.55%和83.02%,证明了MATD3算法在计算卸载和任务迁移方面的有效性和可靠性。 展开更多
关键词 LEO卫星网络 移动边缘计算 matd3算法 计算卸载 卫星通信
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部