期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于DQN的快速路合流区CAV换道决策方法 被引量:1
1
作者 程国柱 王文志 +1 位作者 陈永胜 徐亮 《哈尔滨工业大学学报》 北大核心 2025年第3期98-109,共12页
为解决快速路合流区的交通拥堵和安全问题,保障智能网联车辆(connected and automated vehicle,CAV)在快速路合流区高效、安全、舒适、稳定地行驶,采用深度强化学习方法之DQN(deep q-network)算法,综合考虑车辆行驶安全性、高效性与舒... 为解决快速路合流区的交通拥堵和安全问题,保障智能网联车辆(connected and automated vehicle,CAV)在快速路合流区高效、安全、舒适、稳定地行驶,采用深度强化学习方法之DQN(deep q-network)算法,综合考虑车辆行驶安全性、高效性与舒适性等因素,建立了用于神经网络训练的奖励函数模型,提出了快速路合流区CAV换道决策方法。应用开源自动驾驶仿真场景highway-env,搭建快速路合流区仿真环境,对其主线路段及匝道进行仿真试验。仿真试验结果表明:相比于智能驾驶人模型(intelligent driver model,IDM)和highway-env中换道决策方法,采用所提出的快速路合流区CAV换道决策方法时,CAV能够快速达到22.22 m/s行驶的稳定状态,同时避免频繁换道及加减速行为,并优化了车头时距,很大程度上提高了交通流运行效率和乘车舒适性。研究成果在智能交通领域中,可为智能网联环境下城市快速路合流区的车辆通行提供了一种新方法,为未来智能网联车辆的换道提供了决策方法。 展开更多
关键词 智能交通 CAV换道决策方法 dqn 智能网联车辆 深度强化学习 快速路合流区
在线阅读 下载PDF
带光滑约束的大地电磁深度强化学习反演
2
作者 曾晨瑞 熊杰 +2 位作者 曹振 张倩玮 袁梦姣 《地质科技通报》 北大核心 2026年第1期302-313,共12页
反演是处理大地电磁测深数据的关键步骤之一,得到了学者的广泛研究。其中基于数据驱动的反演方法主要包括带监督反演和半监督反演,对无监督反演的研究较少。DQN(deep Q-network)是一种经典的深度强化学习算法,作为无监督反演方法最近被... 反演是处理大地电磁测深数据的关键步骤之一,得到了学者的广泛研究。其中基于数据驱动的反演方法主要包括带监督反演和半监督反演,对无监督反演的研究较少。DQN(deep Q-network)是一种经典的深度强化学习算法,作为无监督反演方法最近被用于解决一维大地电磁反演问题,该方法具有不需要训练数据集、对初始模型依赖较小、多次反演能够得到反演结果的概率分布等优点,但存在反演结果不集中的问题。提出了带光滑约束的大地电磁强化学习反演方法(smooth DQN,简称SDQN),该方法基于强化学习框架,将反演问题看成马尔可夫决策问题,并分别定义环境、奖励、智能体等术语;然后将正则化反演的模型约束项引入到奖励中来,从而引导智能体不断调整预测模型的电阻率参数以得到更符合模型约束的结果。理论模型反演结果表明,相较于DQN反演和Occam反演方法,在相同反演次数情况下SDQN方法反演不同噪声水平的观测数据时结果更稳定。西藏扎西康矿集区的大地电磁实测数据反演结果与Occam反演结果基本吻合并与已有的地质解释资料一致。SDQN方法具有反演结果更集中、对观测数据的抗噪能力更强的优点,是解决大地电磁反演问题的新工具。 展开更多
关键词 深度强化学习 大地电磁反演 光滑约束 dqn方法 Sdqn方法
在线阅读 下载PDF
融合速度障碍法和DQN的无人船避障方法
3
作者 宗律 李立刚 +2 位作者 贺则昊 韩志强 戴永寿 《电子测量技术》 北大核心 2024年第20期60-67,共8页
为提高无人船(USV)动态避障的安全性与经济性,提出了一种融合速度障碍法和深度Q网络(DQN)的无人船避障方法。首先,在计算传统速度障碍物相对碰撞区域时,考虑障碍物未来时刻运动信息,改善传统速度障碍法因忽略障碍物即时位置变化从而导... 为提高无人船(USV)动态避障的安全性与经济性,提出了一种融合速度障碍法和深度Q网络(DQN)的无人船避障方法。首先,在计算传统速度障碍物相对碰撞区域时,考虑障碍物未来时刻运动信息,改善传统速度障碍法因忽略障碍物即时位置变化从而导致避障失败的问题。其次,将碰撞危险度系数引入DQN状态空间中,优先选取危险度系数最高的障碍物作为避障对象,改善状态空间信息冗余问题。再次,根据改进速度障碍法避障思想重新设计奖励函数,确定无人船避障时机与转向角度,解决传统DQN的奖励稀疏问题,提高其学习效率与收敛速度。最后,为验证该方法性能,与3种主流避障方法进行了仿真实验,实验结果表明,该方法能够为无人船提供合适的避障方向,使无人船航行路径更为经济和安全。此外,通过实船实验验证了该方法具有一定的工程实用价值。 展开更多
关键词 无人船 避障 dqn 奖励函数 速度障碍法
原文传递
基于集成深度强化学习的自动驾驶车辆行为决策模型 被引量:5
4
作者 张新锋 吴琳 《汽车安全与节能学报》 CAS CSCD 北大核心 2023年第4期472-479,共8页
提出一种基于集成的深度强化学习的自动驾驶车辆的行为决策模型。基于Markov决策过程(MDP)理论,采用标准投票法,将深度Q学习网络(DQN)、双DQN(DDQN)和竞争双DDQN(Dueling DDQN)等3种基础网络模型集成。在高速公路仿真环境、在单向3车道... 提出一种基于集成的深度强化学习的自动驾驶车辆的行为决策模型。基于Markov决策过程(MDP)理论,采用标准投票法,将深度Q学习网络(DQN)、双DQN(DDQN)和竞争双DDQN(Dueling DDQN)等3种基础网络模型集成。在高速公路仿真环境、在单向3车道、4车道、5车道数量场景下,对向左换道、车道保持、向右换道、同车道加速和减速等5种车辆驾驶行为,进行测试和泛化性验证。结果表明:与其它3种网络模型相比,该模型的决策成功率分别提高了6%、3%和6%;平均车速也有提升;100回合的测试,耗时小于1 ms,满足决策实时性要求。因而,该决策模型提高了行车安全和决策效率。 展开更多
关键词 自动驾驶 深度强化学习 集成学习 深度Q网络(dqn) 标准投票法
在线阅读 下载PDF
智慧校园通信网络安全通信资源智能分配方法 被引量:5
5
作者 杨志杰 丁国平 潘敏 《长江信息通信》 2024年第9期181-183,共3页
当前校园通信网络资源分配主要依赖目标分配,效率不高,使资源分配易拥塞,为此文章提出智慧校园通信网络安全通信资源智能分配方法。根据当前测定,在进行资源流量预测,采用DQN结构,提升分配效率,设计DQN资源智能分配矩阵的基础上,构建用... 当前校园通信网络资源分配主要依赖目标分配,效率不高,使资源分配易拥塞,为此文章提出智慧校园通信网络安全通信资源智能分配方法。根据当前测定,在进行资源流量预测,采用DQN结构,提升分配效率,设计DQN资源智能分配矩阵的基础上,构建用户优先级网络资源智能分配模型,采用自适应交叉核验的方式来实现资源分配处理。测试结果表明:此次所设计的校园通信网络安全通信资源智能分配方式更加高效、可控,整体的分配环节得到了进一步简化,具有较强的实践性。 展开更多
关键词 智慧校园 资源智能分配 分配方法 深度Q网络
在线阅读 下载PDF
基于深度Q网络的5G网络优化方法
6
作者 于星辉 《通信电源技术》 2023年第19期168-170,共3页
通过探讨基于深度Q网络(Deep Q-Network,DQN)的5G网络优化方法,以提高5G网络的性能和自愈能力。主要研究5G网络的基本架构,包括基站、承载网、电信机房、骨干网络、接入网以及核心网,了解其工作原理,并介绍DQN的结构和数学原理。通过实... 通过探讨基于深度Q网络(Deep Q-Network,DQN)的5G网络优化方法,以提高5G网络的性能和自愈能力。主要研究5G网络的基本架构,包括基站、承载网、电信机房、骨干网络、接入网以及核心网,了解其工作原理,并介绍DQN的结构和数学原理。通过实验测试该方法的可行性。实验结果表明,DQN模型在提升5G网络的自愈能力方面表现出巨大潜力,尤其是在实现最优平均累积奖励和最低均方误差的情况下。 展开更多
关键词 深度Q网络(dqn) 5G网络 自愈能力 优化方法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部