期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于DQN的快速路合流区CAV换道决策方法
被引量:
1
1
作者
程国柱
王文志
+1 位作者
陈永胜
徐亮
《哈尔滨工业大学学报》
北大核心
2025年第3期98-109,共12页
为解决快速路合流区的交通拥堵和安全问题,保障智能网联车辆(connected and automated vehicle,CAV)在快速路合流区高效、安全、舒适、稳定地行驶,采用深度强化学习方法之DQN(deep q-network)算法,综合考虑车辆行驶安全性、高效性与舒...
为解决快速路合流区的交通拥堵和安全问题,保障智能网联车辆(connected and automated vehicle,CAV)在快速路合流区高效、安全、舒适、稳定地行驶,采用深度强化学习方法之DQN(deep q-network)算法,综合考虑车辆行驶安全性、高效性与舒适性等因素,建立了用于神经网络训练的奖励函数模型,提出了快速路合流区CAV换道决策方法。应用开源自动驾驶仿真场景highway-env,搭建快速路合流区仿真环境,对其主线路段及匝道进行仿真试验。仿真试验结果表明:相比于智能驾驶人模型(intelligent driver model,IDM)和highway-env中换道决策方法,采用所提出的快速路合流区CAV换道决策方法时,CAV能够快速达到22.22 m/s行驶的稳定状态,同时避免频繁换道及加减速行为,并优化了车头时距,很大程度上提高了交通流运行效率和乘车舒适性。研究成果在智能交通领域中,可为智能网联环境下城市快速路合流区的车辆通行提供了一种新方法,为未来智能网联车辆的换道提供了决策方法。
展开更多
关键词
智能交通
CAV换道决策方法
dqn
智能网联车辆
深度强化学习
快速路合流区
在线阅读
下载PDF
职称材料
带光滑约束的大地电磁深度强化学习反演
2
作者
曾晨瑞
熊杰
+2 位作者
曹振
张倩玮
袁梦姣
《地质科技通报》
北大核心
2026年第1期302-313,共12页
反演是处理大地电磁测深数据的关键步骤之一,得到了学者的广泛研究。其中基于数据驱动的反演方法主要包括带监督反演和半监督反演,对无监督反演的研究较少。DQN(deep Q-network)是一种经典的深度强化学习算法,作为无监督反演方法最近被...
反演是处理大地电磁测深数据的关键步骤之一,得到了学者的广泛研究。其中基于数据驱动的反演方法主要包括带监督反演和半监督反演,对无监督反演的研究较少。DQN(deep Q-network)是一种经典的深度强化学习算法,作为无监督反演方法最近被用于解决一维大地电磁反演问题,该方法具有不需要训练数据集、对初始模型依赖较小、多次反演能够得到反演结果的概率分布等优点,但存在反演结果不集中的问题。提出了带光滑约束的大地电磁强化学习反演方法(smooth DQN,简称SDQN),该方法基于强化学习框架,将反演问题看成马尔可夫决策问题,并分别定义环境、奖励、智能体等术语;然后将正则化反演的模型约束项引入到奖励中来,从而引导智能体不断调整预测模型的电阻率参数以得到更符合模型约束的结果。理论模型反演结果表明,相较于DQN反演和Occam反演方法,在相同反演次数情况下SDQN方法反演不同噪声水平的观测数据时结果更稳定。西藏扎西康矿集区的大地电磁实测数据反演结果与Occam反演结果基本吻合并与已有的地质解释资料一致。SDQN方法具有反演结果更集中、对观测数据的抗噪能力更强的优点,是解决大地电磁反演问题的新工具。
展开更多
关键词
深度强化学习
大地电磁反演
光滑约束
dqn
方法
S
dqn
方法
在线阅读
下载PDF
职称材料
融合速度障碍法和DQN的无人船避障方法
3
作者
宗律
李立刚
+2 位作者
贺则昊
韩志强
戴永寿
《电子测量技术》
北大核心
2024年第20期60-67,共8页
为提高无人船(USV)动态避障的安全性与经济性,提出了一种融合速度障碍法和深度Q网络(DQN)的无人船避障方法。首先,在计算传统速度障碍物相对碰撞区域时,考虑障碍物未来时刻运动信息,改善传统速度障碍法因忽略障碍物即时位置变化从而导...
为提高无人船(USV)动态避障的安全性与经济性,提出了一种融合速度障碍法和深度Q网络(DQN)的无人船避障方法。首先,在计算传统速度障碍物相对碰撞区域时,考虑障碍物未来时刻运动信息,改善传统速度障碍法因忽略障碍物即时位置变化从而导致避障失败的问题。其次,将碰撞危险度系数引入DQN状态空间中,优先选取危险度系数最高的障碍物作为避障对象,改善状态空间信息冗余问题。再次,根据改进速度障碍法避障思想重新设计奖励函数,确定无人船避障时机与转向角度,解决传统DQN的奖励稀疏问题,提高其学习效率与收敛速度。最后,为验证该方法性能,与3种主流避障方法进行了仿真实验,实验结果表明,该方法能够为无人船提供合适的避障方向,使无人船航行路径更为经济和安全。此外,通过实船实验验证了该方法具有一定的工程实用价值。
展开更多
关键词
无人船
避障
dqn
奖励函数
速度障碍法
原文传递
基于集成深度强化学习的自动驾驶车辆行为决策模型
被引量:
5
4
作者
张新锋
吴琳
《汽车安全与节能学报》
CAS
CSCD
北大核心
2023年第4期472-479,共8页
提出一种基于集成的深度强化学习的自动驾驶车辆的行为决策模型。基于Markov决策过程(MDP)理论,采用标准投票法,将深度Q学习网络(DQN)、双DQN(DDQN)和竞争双DDQN(Dueling DDQN)等3种基础网络模型集成。在高速公路仿真环境、在单向3车道...
提出一种基于集成的深度强化学习的自动驾驶车辆的行为决策模型。基于Markov决策过程(MDP)理论,采用标准投票法,将深度Q学习网络(DQN)、双DQN(DDQN)和竞争双DDQN(Dueling DDQN)等3种基础网络模型集成。在高速公路仿真环境、在单向3车道、4车道、5车道数量场景下,对向左换道、车道保持、向右换道、同车道加速和减速等5种车辆驾驶行为,进行测试和泛化性验证。结果表明:与其它3种网络模型相比,该模型的决策成功率分别提高了6%、3%和6%;平均车速也有提升;100回合的测试,耗时小于1 ms,满足决策实时性要求。因而,该决策模型提高了行车安全和决策效率。
展开更多
关键词
自动驾驶
深度强化学习
集成学习
深度Q网络(
dqn
)
标准投票法
在线阅读
下载PDF
职称材料
智慧校园通信网络安全通信资源智能分配方法
被引量:
5
5
作者
杨志杰
丁国平
潘敏
《长江信息通信》
2024年第9期181-183,共3页
当前校园通信网络资源分配主要依赖目标分配,效率不高,使资源分配易拥塞,为此文章提出智慧校园通信网络安全通信资源智能分配方法。根据当前测定,在进行资源流量预测,采用DQN结构,提升分配效率,设计DQN资源智能分配矩阵的基础上,构建用...
当前校园通信网络资源分配主要依赖目标分配,效率不高,使资源分配易拥塞,为此文章提出智慧校园通信网络安全通信资源智能分配方法。根据当前测定,在进行资源流量预测,采用DQN结构,提升分配效率,设计DQN资源智能分配矩阵的基础上,构建用户优先级网络资源智能分配模型,采用自适应交叉核验的方式来实现资源分配处理。测试结果表明:此次所设计的校园通信网络安全通信资源智能分配方式更加高效、可控,整体的分配环节得到了进一步简化,具有较强的实践性。
展开更多
关键词
智慧校园
资源智能分配
分配方法
深度Q网络
在线阅读
下载PDF
职称材料
基于深度Q网络的5G网络优化方法
6
作者
于星辉
《通信电源技术》
2023年第19期168-170,共3页
通过探讨基于深度Q网络(Deep Q-Network,DQN)的5G网络优化方法,以提高5G网络的性能和自愈能力。主要研究5G网络的基本架构,包括基站、承载网、电信机房、骨干网络、接入网以及核心网,了解其工作原理,并介绍DQN的结构和数学原理。通过实...
通过探讨基于深度Q网络(Deep Q-Network,DQN)的5G网络优化方法,以提高5G网络的性能和自愈能力。主要研究5G网络的基本架构,包括基站、承载网、电信机房、骨干网络、接入网以及核心网,了解其工作原理,并介绍DQN的结构和数学原理。通过实验测试该方法的可行性。实验结果表明,DQN模型在提升5G网络的自愈能力方面表现出巨大潜力,尤其是在实现最优平均累积奖励和最低均方误差的情况下。
展开更多
关键词
深度Q网络(
dqn
)
5G网络
自愈能力
优化方法
在线阅读
下载PDF
职称材料
题名
基于DQN的快速路合流区CAV换道决策方法
被引量:
1
1
作者
程国柱
王文志
陈永胜
徐亮
机构
东北林业大学土木与交通学院
长春工程学院土木工程学院
出处
《哈尔滨工业大学学报》
北大核心
2025年第3期98-109,共12页
基金
中央高校基本科研业务费专项资金(2572023CT21)
国家自然科学基金(52378433)。
文摘
为解决快速路合流区的交通拥堵和安全问题,保障智能网联车辆(connected and automated vehicle,CAV)在快速路合流区高效、安全、舒适、稳定地行驶,采用深度强化学习方法之DQN(deep q-network)算法,综合考虑车辆行驶安全性、高效性与舒适性等因素,建立了用于神经网络训练的奖励函数模型,提出了快速路合流区CAV换道决策方法。应用开源自动驾驶仿真场景highway-env,搭建快速路合流区仿真环境,对其主线路段及匝道进行仿真试验。仿真试验结果表明:相比于智能驾驶人模型(intelligent driver model,IDM)和highway-env中换道决策方法,采用所提出的快速路合流区CAV换道决策方法时,CAV能够快速达到22.22 m/s行驶的稳定状态,同时避免频繁换道及加减速行为,并优化了车头时距,很大程度上提高了交通流运行效率和乘车舒适性。研究成果在智能交通领域中,可为智能网联环境下城市快速路合流区的车辆通行提供了一种新方法,为未来智能网联车辆的换道提供了决策方法。
关键词
智能交通
CAV换道决策方法
dqn
智能网联车辆
深度强化学习
快速路合流区
Keywords
intelligent transportation
CAV lane change decision
method
dqn
intelligent connected vehicles
deep reinforcement learning
expressway merging area
分类号
U461 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
带光滑约束的大地电磁深度强化学习反演
2
作者
曾晨瑞
熊杰
曹振
张倩玮
袁梦姣
机构
长江大学电子信息与电气工程学院
出处
《地质科技通报》
北大核心
2026年第1期302-313,共12页
基金
国家自然科学基金项目(62273060)。
文摘
反演是处理大地电磁测深数据的关键步骤之一,得到了学者的广泛研究。其中基于数据驱动的反演方法主要包括带监督反演和半监督反演,对无监督反演的研究较少。DQN(deep Q-network)是一种经典的深度强化学习算法,作为无监督反演方法最近被用于解决一维大地电磁反演问题,该方法具有不需要训练数据集、对初始模型依赖较小、多次反演能够得到反演结果的概率分布等优点,但存在反演结果不集中的问题。提出了带光滑约束的大地电磁强化学习反演方法(smooth DQN,简称SDQN),该方法基于强化学习框架,将反演问题看成马尔可夫决策问题,并分别定义环境、奖励、智能体等术语;然后将正则化反演的模型约束项引入到奖励中来,从而引导智能体不断调整预测模型的电阻率参数以得到更符合模型约束的结果。理论模型反演结果表明,相较于DQN反演和Occam反演方法,在相同反演次数情况下SDQN方法反演不同噪声水平的观测数据时结果更稳定。西藏扎西康矿集区的大地电磁实测数据反演结果与Occam反演结果基本吻合并与已有的地质解释资料一致。SDQN方法具有反演结果更集中、对观测数据的抗噪能力更强的优点,是解决大地电磁反演问题的新工具。
关键词
深度强化学习
大地电磁反演
光滑约束
dqn
方法
S
dqn
方法
Keywords
deep reinforcement learning
magnetotelluric inversion
smooth constraint
dqn method
S
dqn method
分类号
P631.325 [天文地球—地质矿产勘探]
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
融合速度障碍法和DQN的无人船避障方法
3
作者
宗律
李立刚
贺则昊
韩志强
戴永寿
机构
中国石油大学(华东)海洋与空间信息学院
中国石油大学(华东)控制科学与工程学院
自然资源部海上丝路海洋资源环境组网观测技术创新中心
出处
《电子测量技术》
北大核心
2024年第20期60-67,共8页
基金
国家自然科学基金(42274159)
中央高校基本科研业务费专项资金(24CX02030A)项目资助。
文摘
为提高无人船(USV)动态避障的安全性与经济性,提出了一种融合速度障碍法和深度Q网络(DQN)的无人船避障方法。首先,在计算传统速度障碍物相对碰撞区域时,考虑障碍物未来时刻运动信息,改善传统速度障碍法因忽略障碍物即时位置变化从而导致避障失败的问题。其次,将碰撞危险度系数引入DQN状态空间中,优先选取危险度系数最高的障碍物作为避障对象,改善状态空间信息冗余问题。再次,根据改进速度障碍法避障思想重新设计奖励函数,确定无人船避障时机与转向角度,解决传统DQN的奖励稀疏问题,提高其学习效率与收敛速度。最后,为验证该方法性能,与3种主流避障方法进行了仿真实验,实验结果表明,该方法能够为无人船提供合适的避障方向,使无人船航行路径更为经济和安全。此外,通过实船实验验证了该方法具有一定的工程实用价值。
关键词
无人船
避障
dqn
奖励函数
速度障碍法
Keywords
USV
obstacle avoidance
dqn
reward function
velocity obstacle
method
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
TN966 [电子电信—信号与信息处理]
原文传递
题名
基于集成深度强化学习的自动驾驶车辆行为决策模型
被引量:
5
4
作者
张新锋
吴琳
机构
长安大学汽车学院
出处
《汽车安全与节能学报》
CAS
CSCD
北大核心
2023年第4期472-479,共8页
基金
陕西省重点研发计划项目(2022GY-303)
西安市科技计划项目(2022GXFW0152)。
文摘
提出一种基于集成的深度强化学习的自动驾驶车辆的行为决策模型。基于Markov决策过程(MDP)理论,采用标准投票法,将深度Q学习网络(DQN)、双DQN(DDQN)和竞争双DDQN(Dueling DDQN)等3种基础网络模型集成。在高速公路仿真环境、在单向3车道、4车道、5车道数量场景下,对向左换道、车道保持、向右换道、同车道加速和减速等5种车辆驾驶行为,进行测试和泛化性验证。结果表明:与其它3种网络模型相比,该模型的决策成功率分别提高了6%、3%和6%;平均车速也有提升;100回合的测试,耗时小于1 ms,满足决策实时性要求。因而,该决策模型提高了行车安全和决策效率。
关键词
自动驾驶
深度强化学习
集成学习
深度Q网络(
dqn
)
标准投票法
Keywords
autonomous driving
deep reinforcement learning
ensemble learning
deep Q-network(
dqn
)
standard voting
method
分类号
U461 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
智慧校园通信网络安全通信资源智能分配方法
被引量:
5
5
作者
杨志杰
丁国平
潘敏
机构
金肯职业技术学院
出处
《长江信息通信》
2024年第9期181-183,共3页
基金
江苏省现代教育技术研究所智慧校园项目(2019-R-75631:2020-R-84350)。
文摘
当前校园通信网络资源分配主要依赖目标分配,效率不高,使资源分配易拥塞,为此文章提出智慧校园通信网络安全通信资源智能分配方法。根据当前测定,在进行资源流量预测,采用DQN结构,提升分配效率,设计DQN资源智能分配矩阵的基础上,构建用户优先级网络资源智能分配模型,采用自适应交叉核验的方式来实现资源分配处理。测试结果表明:此次所设计的校园通信网络安全通信资源智能分配方式更加高效、可控,整体的分配环节得到了进一步简化,具有较强的实践性。
关键词
智慧校园
资源智能分配
分配方法
深度Q网络
Keywords
smart campus
intelligent allocation of resources
allocation
method
DeepQ-Net-Work(
dqn
)
分类号
TN929.1 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于深度Q网络的5G网络优化方法
6
作者
于星辉
机构
郑州工业应用技术学院
出处
《通信电源技术》
2023年第19期168-170,共3页
文摘
通过探讨基于深度Q网络(Deep Q-Network,DQN)的5G网络优化方法,以提高5G网络的性能和自愈能力。主要研究5G网络的基本架构,包括基站、承载网、电信机房、骨干网络、接入网以及核心网,了解其工作原理,并介绍DQN的结构和数学原理。通过实验测试该方法的可行性。实验结果表明,DQN模型在提升5G网络的自愈能力方面表现出巨大潜力,尤其是在实现最优平均累积奖励和最低均方误差的情况下。
关键词
深度Q网络(
dqn
)
5G网络
自愈能力
优化方法
Keywords
Deep Q-Network(
dqn
)
5G network
self-healing ability
optimization
method
分类号
TN929.5 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于DQN的快速路合流区CAV换道决策方法
程国柱
王文志
陈永胜
徐亮
《哈尔滨工业大学学报》
北大核心
2025
1
在线阅读
下载PDF
职称材料
2
带光滑约束的大地电磁深度强化学习反演
曾晨瑞
熊杰
曹振
张倩玮
袁梦姣
《地质科技通报》
北大核心
2026
0
在线阅读
下载PDF
职称材料
3
融合速度障碍法和DQN的无人船避障方法
宗律
李立刚
贺则昊
韩志强
戴永寿
《电子测量技术》
北大核心
2024
0
原文传递
4
基于集成深度强化学习的自动驾驶车辆行为决策模型
张新锋
吴琳
《汽车安全与节能学报》
CAS
CSCD
北大核心
2023
5
在线阅读
下载PDF
职称材料
5
智慧校园通信网络安全通信资源智能分配方法
杨志杰
丁国平
潘敏
《长江信息通信》
2024
5
在线阅读
下载PDF
职称材料
6
基于深度Q网络的5G网络优化方法
于星辉
《通信电源技术》
2023
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部