期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于改进MAAC算法的多无人机自主路径规划 被引量:2
1
作者 周从航 李建兴 +1 位作者 石宇静 林致睿 《无线电工程》 2024年第7期1816-1823,共8页
利用深度强化学习方法对威胁区域环境下多无人机(UAV)自主路径规划问题进行研究。为了解决强化学习算法中普遍存在难以收敛的问题,提出了一种改进的Actor-Attention-Critic for Multi-Agent Reinforcement Learning (MAAC)算法用于多UA... 利用深度强化学习方法对威胁区域环境下多无人机(UAV)自主路径规划问题进行研究。为了解决强化学习算法中普遍存在难以收敛的问题,提出了一种改进的Actor-Attention-Critic for Multi-Agent Reinforcement Learning (MAAC)算法用于多UAV的自主路径规划。通过建立多UAV势场环境模型定义强化学习的马尔科夫决策过程(Markov Modulated Process, MDP),在动态环境中规划出合理的无碰撞路径。仿真实验验证了所设计的多UAV自主路径规划控制算法的有效性,并通过对比仿真验证了该算法在收敛速度和避免碰撞方面具有更优越的性能。 展开更多
关键词 无人机 多智能体深度强化学习 自主路径规划 maac算法
在线阅读 下载PDF
基于MAAC算法的城市电网多能系统低碳经济调度方法
2
作者 刘珅 任有刚 +3 位作者 王宏波 张兴 刘旭东 朱灏 《供用电》 北大核心 2025年第5期72-82,共11页
“双碳”背景下,城市电网多能系统成为能源行业低碳化转型的重要支撑。然而,城市电网多能系统的低碳经济调度正面临碳排放量季节性差异显著、多能系统决策变量维度高且耦合性强等难点。为此,提出一种基于多智能体行为-注意力机制-评判(m... “双碳”背景下,城市电网多能系统成为能源行业低碳化转型的重要支撑。然而,城市电网多能系统的低碳经济调度正面临碳排放量季节性差异显著、多能系统决策变量维度高且耦合性强等难点。为此,提出一种基于多智能体行为-注意力机制-评判(multi-agent actor-attention-critic,MAAC)算法的城市电网多能系统低碳经济调度方法,旨在提升强耦合系统的降碳运行能力。首先,针对季节尺度上城市电网碳排放量的异质特征,建立季节性阶梯碳交易机制以实现碳排放配额的合理分配;然后,利用深度强化学习算法避免决策变量高维导致的收敛困难,使用改进的MAAC算法求解调度策略,利用注意力机制弥补智能体在强耦合系统中探索能力不足的问题;最后,进行多场景多算法对比算例分析,验证了该方法在调度低碳性、经济性上的优势。 展开更多
关键词 城市电网多能系统 低碳经济调度 季节性阶梯碳交易 多智能体深度强化学习 maac算法
在线阅读 下载PDF
基于深度强化学习的站所一体化下动走线通过能力适应性评估方法研究
3
作者 陈韬 徐梦婷 潘金山 《铁道学报》 2026年第3期16-27,共12页
随着高速铁路车站和动车所规模进一步扩大,存在动车所动走线通过能力在实际运用中难以达到设计值,不适应终到、始发列车高峰时段高速铁路车站行车需求的情况,主要原因是设计时缺乏高速铁路车站、动走线、动车所三个子系统一体化下的能... 随着高速铁路车站和动车所规模进一步扩大,存在动车所动走线通过能力在实际运用中难以达到设计值,不适应终到、始发列车高峰时段高速铁路车站行车需求的情况,主要原因是设计时缺乏高速铁路车站、动走线、动车所三个子系统一体化下的能力适应性检算。以高峰时段内尽可能达到高速铁路车站需要接发列车数为目标,采用深度强化学习方法,构建站所一体化场景下动走线通过能力适应性评估模型。模型中嵌入列车运行约束检测模块,设计MAAC多智能体强化学习求解算法,最终生成站所一体化协调作业计划,实现动走线通过能力与高速铁路车站行车作业需求的适应性判定。经某实际站所系统案例验证,模型与算法具备合理性,为大规模站所动走线设计及运用优化提供理论支撑。 展开更多
关键词 站所一体化 动走线通过能力 适应性评估 深度强化学习 maac算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部