期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于强化学习的自动驾驶车辆路上突发障碍物换道避障控制算法
1
作者 姚恩建 陈卓利 +2 位作者 郝赫 陈荣升 杨扬 《北京交通大学学报》 北大核心 2025年第5期82-93,共12页
针对路上突发障碍物下自动驾驶车辆换道避障问题,提出基于深度强化学习(Deep Rein-forcement Learning,DRL)的车辆控制算法SafeLC-DelayDDPG.首先,将该问题建模为马尔可夫决策过程(Markov Decision Process,MDP),构建了结构化混合状态空... 针对路上突发障碍物下自动驾驶车辆换道避障问题,提出基于深度强化学习(Deep Rein-forcement Learning,DRL)的车辆控制算法SafeLC-DelayDDPG.首先,将该问题建模为马尔可夫决策过程(Markov Decision Process,MDP),构建了结构化混合状态空间,融合局部观测、车道语义信息和自车全局状态,提高环境感知与风险敏感性.动作空间采用连续的前轮转向角与纵向加速度.奖励函数以二维碰撞时间(Two-dimensional time-to-collision,2D-TTC)指标为核心,兼顾安全、效率、舒适和规则,并采用条件化动态权重机制,引导策略在高风险时优先安全、在低风险时提升效率.然后,引入延迟策略更新与目标策略平滑机制,改进Critic网络损失函数,缓解深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法训练不稳定及Q值过估计问题.最后,通过不同场景下的交通仿真验证了所提方法的有效性.仿真结果表明:与多个基线算法相比,该算法安全性与效率更优,训练期首次和连续避障成功率分别最多提升约17.9%和60.5%,安全性指标值最多提升约7.6%,平均速度最多提升约2.1%;在不同场景测试中,首次和连续避障成功率分别最多提升约25.9%和44.1%,安全性指标值最多提升约9.8%,平均速度最多提升约0.6%. 展开更多
关键词 自动驾驶车辆 路上突发障碍物 深度强化学习 2D-TTC 换道避障控制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部