期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于强化学习的自动驾驶车辆路上突发障碍物换道避障控制算法
1
作者
姚恩建
陈卓利
+2 位作者
郝赫
陈荣升
杨扬
《北京交通大学学报》
北大核心
2025年第5期82-93,共12页
针对路上突发障碍物下自动驾驶车辆换道避障问题,提出基于深度强化学习(Deep Rein-forcement Learning,DRL)的车辆控制算法SafeLC-DelayDDPG.首先,将该问题建模为马尔可夫决策过程(Markov Decision Process,MDP),构建了结构化混合状态空...
针对路上突发障碍物下自动驾驶车辆换道避障问题,提出基于深度强化学习(Deep Rein-forcement Learning,DRL)的车辆控制算法SafeLC-DelayDDPG.首先,将该问题建模为马尔可夫决策过程(Markov Decision Process,MDP),构建了结构化混合状态空间,融合局部观测、车道语义信息和自车全局状态,提高环境感知与风险敏感性.动作空间采用连续的前轮转向角与纵向加速度.奖励函数以二维碰撞时间(Two-dimensional time-to-collision,2D-TTC)指标为核心,兼顾安全、效率、舒适和规则,并采用条件化动态权重机制,引导策略在高风险时优先安全、在低风险时提升效率.然后,引入延迟策略更新与目标策略平滑机制,改进Critic网络损失函数,缓解深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法训练不稳定及Q值过估计问题.最后,通过不同场景下的交通仿真验证了所提方法的有效性.仿真结果表明:与多个基线算法相比,该算法安全性与效率更优,训练期首次和连续避障成功率分别最多提升约17.9%和60.5%,安全性指标值最多提升约7.6%,平均速度最多提升约2.1%;在不同场景测试中,首次和连续避障成功率分别最多提升约25.9%和44.1%,安全性指标值最多提升约9.8%,平均速度最多提升约0.6%.
展开更多
关键词
自动驾驶车辆
路上突发障碍物
深度强化学习
2D-TTC
换道避障控制
在线阅读
下载PDF
职称材料
题名
基于强化学习的自动驾驶车辆路上突发障碍物换道避障控制算法
1
作者
姚恩建
陈卓利
郝赫
陈荣升
杨扬
机构
北京交通大学交通运输学院
出处
《北京交通大学学报》
北大核心
2025年第5期82-93,共12页
基金
国家重点研发计划(2023YFB4302703)。
文摘
针对路上突发障碍物下自动驾驶车辆换道避障问题,提出基于深度强化学习(Deep Rein-forcement Learning,DRL)的车辆控制算法SafeLC-DelayDDPG.首先,将该问题建模为马尔可夫决策过程(Markov Decision Process,MDP),构建了结构化混合状态空间,融合局部观测、车道语义信息和自车全局状态,提高环境感知与风险敏感性.动作空间采用连续的前轮转向角与纵向加速度.奖励函数以二维碰撞时间(Two-dimensional time-to-collision,2D-TTC)指标为核心,兼顾安全、效率、舒适和规则,并采用条件化动态权重机制,引导策略在高风险时优先安全、在低风险时提升效率.然后,引入延迟策略更新与目标策略平滑机制,改进Critic网络损失函数,缓解深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法训练不稳定及Q值过估计问题.最后,通过不同场景下的交通仿真验证了所提方法的有效性.仿真结果表明:与多个基线算法相比,该算法安全性与效率更优,训练期首次和连续避障成功率分别最多提升约17.9%和60.5%,安全性指标值最多提升约7.6%,平均速度最多提升约2.1%;在不同场景测试中,首次和连续避障成功率分别最多提升约25.9%和44.1%,安全性指标值最多提升约9.8%,平均速度最多提升约0.6%.
关键词
自动驾驶车辆
路上突发障碍物
深度强化学习
2D-TTC
换道避障控制
Keywords
autonomous vehicles
unexpected on-road obstacles
deep reinforcement learning
2dttc
lane-change obstacle-avoidance control
分类号
U461.6 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于强化学习的自动驾驶车辆路上突发障碍物换道避障控制算法
姚恩建
陈卓利
郝赫
陈荣升
杨扬
《北京交通大学学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部