-
题名基于MAPPO的无信号灯交叉口自动驾驶决策
被引量:1
- 1
-
-
作者
许曼晨
于镝
赵理
郭陈栋
-
机构
北京信息科技大学自动化学院
北京信息科技大学机电工程学院
-
出处
《吉林大学学报(信息科学版)》
CAS
2024年第5期790-798,共9页
-
基金
国家自然科学基金资助项目(52077007)。
-
文摘
针对自动驾驶在通过无信号灯交叉口由于车流密集且车辆行为随机不确定的问题,提出一种基于MAPPO(Multi-Agent Proximal Policy Optimization)算法的无信号灯交叉口自动驾驶决策方案。通过MetaDrive仿真环平台搭建多智能体仿真环境,并且设计了综合考虑交通规则、安全到达或发生碰撞等安全性以及交叉口车辆最大、最小速度等车流效率的奖励函数,旨在实现安全高效的自动驾驶决策。仿真实验表明,所提出的自动驾驶决策方案在训练中相较于其他算法具有更出色的稳定性和收敛性,在不同车流密度下均呈现出更高的成功率和安全性。该自动驾驶决策方案在解决无信号灯交叉口环境方面具有显著潜力,并且为复杂路况自动驾驶决策的研究起到促进作用。
-
关键词
自动驾驶
智能决策
无信号灯交叉口
mappo算法
-
Keywords
autonomous driving
intelligent decision-making
signal-free intersections
multi-agent proximal policy optimization(mappo)algorithm
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名一种空中近距离多机自主博弈决策方法研究
- 2
-
-
作者
霍琳
王楚迪
李泽铎
-
机构
沈阳航空航天大学
-
出处
《兵器装备工程学报》
北大核心
2025年第S1期193-199,共7页
-
文摘
针对空中近距离多机自主博弈训练过程中对手的构建以及选择问题,本文提出一种新的自主博弈决策方法以提升决策效率及性能。主要是结合优先级虚构自博弈(priority fictitious self-play,PFSP)和多智能体近端策略优化(multi-agent proximal policy optimization,MAPPO)的方法,采用F-16模型构建了高保真的2v2空中对抗场景。通过虚拟对抗场景实施了一系列对比仿真实验,结果显示,PFSP-MAPPO算法在多智能体协同决策任务中展现出卓越的策略性能,验证了所提方法的有效性与优越性。
-
关键词
多智能体
协同决策
博弈对抗
自主决策
强化学习
mappo算法
-
Keywords
multi-agent
collaborative decision-making
game confrontation
autonomous decision-making
reinforcement learning
mappo algorithm
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
V279
[航空宇航科学与技术—飞行器设计]
-
-
题名基于多智能体强化学习的交叉道路车辆协同控制
- 3
-
-
作者
申元霞
谢悦
张学锋
汤亚玲
储岳中
-
机构
安徽工业大学特种重载机器人安徽省重点实验室
-
出处
《西华大学学报(自然科学版)》
2025年第4期40-48,共9页
-
基金
安徽高校自然科学研究项目(2022AH050290)
特种重载机器人安徽省重点实验室项目(TZJQR007-2023)。
-
文摘
为提升自动驾驶车辆在城市交叉道路的快速反应和安全通行能力,提出一种基于MAPPO-RCNN算法的多智能体强化学习车辆协同控制策略。利用车辆传感器采集的未加工原始RGB图像作为输入,使用MAPPO算法实现车辆间的协同控制,直接输出车辆动作;考虑车辆间相互位置对通行任务的影响,优化车辆通行时间和安全性,同时设计策略生成算法和优化目标函数;为防止策略陷入局部最优,使用纳什均衡判断策略收敛。在CARLA仿真平台上的实验仿真结果表明,该车辆协同控制策略能在一定程度上提高交叉路口自动驾驶车辆的通行效果,并保证控制系统的稳定性。
-
关键词
车辆协同控制
mappo-RCNN算法
端到端
多智能体系统
策略生成算法
交通流优化
CARLA仿真
-
Keywords
cooperative vehicle control
mappo-RCNN algorithms
end-to-end
multi-intelligent body systems
policy generation algorithms
traffic flow optimization
CARLA simulation
-
分类号
U491.1
[交通运输工程—交通运输规划与管理]
-
-
题名基于多智能体强化学习的防空编队部署方法
被引量:2
- 4
-
-
作者
简泽民
申国伟
刘莉
王美琪
-
机构
贵州大学计算机科学与技术学院公共大数据国家重点实验室
江南机电设计研究所
-
出处
《电光与控制》
CSCD
北大核心
2024年第12期91-97,共7页
-
基金
黔科合平台人才-CXTD[2021]003。
-
文摘
针对防空编队智能部署方法无法同时兼顾区域掩护和目标掩护、人为制定复杂规则难以求解、算法执行效率较低的问题,提出一种基于独立多智能体近端策略优化(IN-MAPPO)的防空编队部署方法。设计独立的行动者-评论家网络,以适应火力单元的不同角色,通过集中式价值函数和奖励函数促进火力单元协同合作完成混合部署任务,提高编队的抗击能力和整体部署性能。实验结果表明:IN-MAPPO方法能够依据智能体的角色完成混合部署任务,提高远程火力单元的抗击能力,比其他MAPPO算法减少了13.7%的训练时间;与现有智能算法相比,火力单元覆盖面积提升了4.2%,有效掩护宽度提升了12.3%,算法的执行效率提高了95.9%。
-
关键词
区域掩护
目标掩护
独立参数
IN-mappo算法
-
Keywords
area cover
target cover
independent parameters
IN-mappo algorithm
-
分类号
E92
[兵器科学与技术—武器系统与运用工程]
-
-
题名基于多智能体深度强化学习的无人机路径规划
被引量:10
- 5
-
-
作者
司鹏搏
吴兵
杨睿哲
李萌
孙艳华
-
机构
北京工业大学信息学部
-
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2023年第4期449-458,共10页
-
基金
国家自然科学基金资助项目(61901011)
北京市教育委员会科技项目(KM202010005017,KM202110005021)。
-
文摘
为解决多无人机(unmanned aerial vehicle, UAV)在复杂环境下的路径规划问题,提出一个多智能体深度强化学习UAV路径规划框架.该框架首先将路径规划问题建模为部分可观测马尔可夫过程,采用近端策略优化算法将其扩展至多智能体,通过设计UAV的状态观测空间、动作空间及奖赏函数等实现多UAV无障碍路径规划;其次,为适应UAV搭载的有限计算资源条件,进一步提出基于网络剪枝的多智能体近端策略优化(network pruning-based multi-agent proximal policy optimization, NP-MAPPO)算法,提高了训练效率.仿真结果验证了提出的多UAV路径规划框架在各参数配置下的有效性及NP-MAPPO算法在训练时间上的优越性.
-
关键词
无人机(unmanned
aerial
vehicle
UAV)
复杂环境
路径规划
马尔可夫决策过程
多智能体近端策略优化算法(multi-agent
proximal
policy
optimization
mappo)
网络剪枝(network
pruning
NP)
-
Keywords
unmanned aerial vehicle(UAV)
complex environment
path planning
Markov decision process
multi-agent proximal policy optimization(mappo)algorithm
network pruning(NP)
-
分类号
U461
[机械工程—车辆工程]
TP308
[自动化与计算机技术—计算机系统结构]
-