期刊文献+
共找到353篇文章
< 1 2 18 >
每页显示 20 50 100
基于改进DQN的多深度四向穿梭车仓储系统货位分配研究
1
作者 武照云 赵彬彬 +3 位作者 张中伟 李丽 高增恩 金涛 《现代电子技术》 北大核心 2026年第2期178-186,共9页
为解决多深度四向穿梭车仓储系统中因货位分配不合理带来的出库作业效率低、穿梭车拥堵等问题,提出一种基于改进DQN的货位分配优化方法。首先,根据多深度四向穿梭车仓储系统货位分配问题的特点,构建以出入库效率、货架稳定性、巷道作业... 为解决多深度四向穿梭车仓储系统中因货位分配不合理带来的出库作业效率低、穿梭车拥堵等问题,提出一种基于改进DQN的货位分配优化方法。首先,根据多深度四向穿梭车仓储系统货位分配问题的特点,构建以出入库效率、货架稳定性、巷道作业均衡性为目标的优化模型;然后,定义改进DQN的状态-动作空间、奖励函数等,引入优先经验回放机制以增大优质样本的权重并降低数据的相关性,同时引入决斗网络机制区分各动作的相对优势,更好地估计Q值,进而提升复杂高维度状态空间中的训练效率和稳定性。仿真实验结果表明,改进DQN算法的优化结果和收敛速度均优于遗传算法(GA)和DQN,其性能比GA提高了3.91%~18.18%,比DQN提高了3.66%~15.09%,而且在大规模货架和批量订单场景中优势更加显著。 展开更多
关键词 四向穿梭车 货位分配 改进dqn 优先经验回放 决斗网络 状态空间
在线阅读 下载PDF
融合GAT与可解释DQN的SQL注入攻击检测模型
2
作者 邓钰洋 芦天亮 +2 位作者 李知皓 孟昊阳 马远声 《信息网络安全》 北大核心 2026年第1期150-167,共18页
随着Web应用的持续演进及数据库驱动系统的广泛部署,SQL注入攻击作为一种高度隐蔽且破坏力强的网络攻击方式,依然是当前Web安全防护的重要研究对象。针对SQL注入语句结构复杂、语义多样以及攻击样本稀缺等问题,文章提出一种融合图结构... 随着Web应用的持续演进及数据库驱动系统的广泛部署,SQL注入攻击作为一种高度隐蔽且破坏力强的网络攻击方式,依然是当前Web安全防护的重要研究对象。针对SQL注入语句结构复杂、语义多样以及攻击样本稀缺等问题,文章提出一种融合图结构建模与强化学习机制的SQL注入攻击检测方法。该方法将SQL语句建模为图结构,通过改进的图注意力网络GAT融合节点与边的语法特征,并构建了包含4个专门化检测专家的多智能体强化学习框架,实现动态集成决策。同时,该检测方法设计了针对SQL注入攻击混淆特点的对抗样本生成模块,增强了模型对复杂变形攻击的识别能力。此外,结合LIME与SHAP方法对检测结果进行可解释性分析,增强系统的透明度与实用性。实验结果表明,该方法在保持较低计算资源消耗的前提下,有效缓解了样本不均衡与攻击模式多样化引起的检测偏差问题。该方法在综合性SQL注入数据集上的检测准确率达0.955,AUC值为0.978,显著优于现有基线方法,为SQL注入攻击的智能化检测提供了有效解决方案。 展开更多
关键词 SQL注入攻击检测 图注意力网络 多智能体 dqn 可解释强化学习
在线阅读 下载PDF
基于Stackelberg博弈和DQN的多类型蜜罐部署方案
3
作者 韩雨 陈元恒 +2 位作者 王一川 马艺宾 黑新宏 《通信学报》 北大核心 2026年第2期261-273,共13页
针对传统蜜罐部署方案在面对日益复杂的网络环境时存在动态适应性差、诱捕能力不足等问题,基于CIC-IDS-2017攻击数据集,提出了一种基于Stackelberg博弈和深度Q网络(DQN)的多类型动态蜜罐部署方案。首先,通过对攻击行为时间−状态建模捕... 针对传统蜜罐部署方案在面对日益复杂的网络环境时存在动态适应性差、诱捕能力不足等问题,基于CIC-IDS-2017攻击数据集,提出了一种基于Stackelberg博弈和深度Q网络(DQN)的多类型动态蜜罐部署方案。首先,通过对攻击行为时间−状态建模捕捉攻击行为的时序演化特征,结合马尔可夫预测实现对未知攻击的预判。其次,根据不同蜜罐(低交互、中交互、高交互和拟态蜜罐)的部署成本和诱捕能力的差异性,设计融合攻防效益的综合效用函数。最后,通过Stackelberg博弈主导角色动态切换与DQN策略优化,实现固定资源约束下的最优部署,进一步提升策略的动态适应性。仿真结果表明,所提方案能够有效应对攻击行为的时序演变状态,并在固定资源约束下给出最优的蜜罐部署方案,提升了防御系统的自适应性。此外,该方案对时序攻击的诱捕成功率达96%(在拟态蜜罐情况下),防御效用较传统方案提升35%,且能动态适应多类型攻击场景。 展开更多
关键词 网络安全 蜜罐诱捕 动态部署 动态博弈 深度Q网络
在线阅读 下载PDF
复杂电磁环境下基于HRDQN的智能干扰决策算法
4
作者 刘天一 吴宣利 +2 位作者 许涛 王吉彬 李广华 《通信学报》 北大核心 2026年第2期94-108,共15页
针对通信对抗中现有智能干扰决策面对复杂电磁环境收敛速度慢以及干扰能效低等问题,提出了一种基于分层Rainbow DQN(HRDQN)的智能干扰决策算法。首先,构建了存在非合作智能干扰的通信系统模型,将干扰决策过程建模为马尔可夫决策过程(MD... 针对通信对抗中现有智能干扰决策面对复杂电磁环境收敛速度慢以及干扰能效低等问题,提出了一种基于分层Rainbow DQN(HRDQN)的智能干扰决策算法。首先,构建了存在非合作智能干扰的通信系统模型,将干扰决策过程建模为马尔可夫决策过程(MDP),并推导了压制系数门限作为干扰效果的判断依据;其次,基于分层结构设计了智能体的动作空间和决策方法,从而提升了决策效率;最后,结合压制系数门限及所估计干信比(JSR)设计了算法的奖励函数,确保算法稳定收敛。仿真结果表明,所提算法能够在快速生成理想干扰决策的同时降低干扰功耗,相较于传统智能干扰决策算法,具有更快的收敛速度,验证了所提算法的有效性。 展开更多
关键词 通信对抗 智能干扰决策 马尔可夫决策过程 分层Rainbow-dqn算法 能量效率
在线阅读 下载PDF
基于DQN的暖通空调热舒适与节能智能优化控制技术
5
作者 李风旭 宿卫卫 +1 位作者 高振海 付文豪 《科技创新与应用》 2026年第9期176-179,共4页
为打造舒适性、环境性建筑,建筑工程建设时需科学设计暖通空调控制系统,应选择适合的控制算法,确保热舒适度、能耗得以智能化、科学性调控。为达到这一目的,选用DQN算法,设计一款具有热舒适与节能智能控制功能的控制系统。先分析DQN的... 为打造舒适性、环境性建筑,建筑工程建设时需科学设计暖通空调控制系统,应选择适合的控制算法,确保热舒适度、能耗得以智能化、科学性调控。为达到这一目的,选用DQN算法,设计一款具有热舒适与节能智能控制功能的控制系统。先分析DQN的原理及算法,依次展开系统结构设计、控制流程设计以及仿真框架设计,再介绍控制算法应用及参数设置方法,最后分析仿真试验结果。结果表明,采用DQN算法设计的暖通空调智能控制系统,具有良好的热舒适度调控功能以及降耗性能,可以满足建筑工程暖通空调的节能环保控制需求。 展开更多
关键词 暖通空调 热舒适 节能 智能控制 dqn
在线阅读 下载PDF
基于DQN算法的直流微电网负载接口变换器自抗扰控制策略 被引量:8
6
作者 周雪松 韩静 +3 位作者 马幼捷 陶珑 问虎龙 赵明 《电力系统保护与控制》 北大核心 2025年第1期95-103,共9页
在直流微电网中,为了保证直流母线与负载之间能量流动的稳定性,解决在能量流动中不确定因素产生的扰动问题。在建立DC-DC变换器数学模型的基础上,设计了一种基于深度强化学习的DC-DC变换器自抗扰控制策略。利用线性扩张观测器对总扰动... 在直流微电网中,为了保证直流母线与负载之间能量流动的稳定性,解决在能量流动中不确定因素产生的扰动问题。在建立DC-DC变换器数学模型的基础上,设计了一种基于深度强化学习的DC-DC变换器自抗扰控制策略。利用线性扩张观测器对总扰动的估计补偿和线性误差反馈控制特性对自抗扰控制器结构进行简化设计,并结合深度强化学习对其控制器参数进行在线优化。根据不同工况下的负载侧电压波形,分析了DC-DC变换器在该控制策略、线性自抗扰控制与比例积分控制下的稳定性、抗扰性和鲁棒性,验证了该控制策略的正确性和有效性。最后,在参数摄动下进行了蒙特卡洛实验,仿真结果表明该控制策略具有较好的鲁棒性。 展开更多
关键词 直流微电网 深度强化学习 dqn算法 DC-DC变换器 线性自抗扰控制
在线阅读 下载PDF
基于改进DQN算法的船舶全局路径规划研究 被引量:2
7
作者 关巍 曲胜 +1 位作者 张显库 胡彤博 《中国舰船研究》 北大核心 2025年第1期107-114,共8页
[目的]为提升实际海域环境下船舶航行路径的经济性与安全性,提出一种改进深度Q网络(DQN)算法的船舶全局路径规划方法。[方法]首先,引入优先经验回放机制赋予重要样本更高的权重,提升学习效率;然后,再通过决斗网络和噪声网络改进DQN的网... [目的]为提升实际海域环境下船舶航行路径的经济性与安全性,提出一种改进深度Q网络(DQN)算法的船舶全局路径规划方法。[方法]首先,引入优先经验回放机制赋予重要样本更高的权重,提升学习效率;然后,再通过决斗网络和噪声网络改进DQN的网络结构,使其对特定状态及其动作的价值评估更加准确,并同时具备一定的探索性和泛化性。[结果]实验结果表明,在马尼拉附近海域环境下,相比于A^(*)算法和DQN算法,改进算法在路径长度上分别缩短了1.9%和1.0%,拐点数量上分别减少了62.5%和25%。[结论]实验结果验证了改进DQN算法能够更经济、更合理地规划出有效路径。 展开更多
关键词 船舶 运动规划 dqn算法 优先经验回放(PER)
在线阅读 下载PDF
基于DQN和圆拟合的机器人手眼标定方法
8
作者 储昭碧 何沣奕 +1 位作者 高金辉 彭乐峰 《仪器仪表学报》 北大核心 2025年第8期330-340,共11页
近年来,随着工业机器人技术的不断发展,机器人搭载激光测距仪实现多姿态测量的应用场景和对手眼标定的需求逐渐增多,对手眼标定技术的精度提出了更高要求,而传统标定方法往往依赖专用标定物或传感器,操作复杂且成本较高。故提出了一种... 近年来,随着工业机器人技术的不断发展,机器人搭载激光测距仪实现多姿态测量的应用场景和对手眼标定的需求逐渐增多,对手眼标定技术的精度提出了更高要求,而传统标定方法往往依赖专用标定物或传感器,操作复杂且成本较高。故提出了一种基于深度Q网络(DQN)算法和圆轮廓拟合的机器人手眼标定方法。利用DQN算法控制机器人末端两关节带动激光测距仪运动,使得激光测距仪返回值最小,在此基础上,建立机械臂运动学模型计算得到此时光点的理论坐标值。通过设定关节一的多个角度值,使光点在目标平面形成一个圆轨迹,对实际采集的光点坐标值进行圆拟合,建立等式约束下的优化模型,求解得到手眼标定的参数值。基于MATLAB平台模拟仿真,对该方法的可行性进行了验证,分析了角度参数和位移参数初始值对标定结果的影响和抗激光测距噪声干扰的性能。与其他标定方法进行对比,结果显示该方法具有更高的精度。搭建了实验系统,利用该方法求解标定参数,实验结果表明,标定后的系统扫描实验误差不大于0.5 mm,满足工业应用的精度要求。该方法无需额外昂贵的标定物,仅依靠激光测距仪的单测量量和几何约束,显著降低了标定成本与操作难度,同时具备良好的抗噪声性能,能实现工业现场高精度标定。 展开更多
关键词 手眼标定 强化学习 dqn算法 圆拟合
原文传递
基于分层自主决策和DQN的自适应牧羊控制方法 被引量:1
9
作者 赵江 杨智 +1 位作者 池沛 王英勋 《控制与决策》 北大核心 2025年第5期1523-1532,共10页
牧羊控制方法逐渐被应用于机场鸟群驱离、无人机放牧、空地协同监视和引导等大规模集群运动协调问题.以牧羊无人机为例,提出基于分层自主决策和深度Q网络(DQN)的自适应牧羊控制方法.首先,考虑离群个体活跃度衰减等因素,建立牧羊控制问... 牧羊控制方法逐渐被应用于机场鸟群驱离、无人机放牧、空地协同监视和引导等大规模集群运动协调问题.以牧羊无人机为例,提出基于分层自主决策和深度Q网络(DQN)的自适应牧羊控制方法.首先,考虑离群个体活跃度衰减等因素,建立牧羊控制问题的感知和运动模型;然后,针对个体滞留和离群问题,提出基于全局质心的弧形轨迹(GCM-Arc)控制方法和避障策略,提升羊群受控个体占比;最后,建立分层自主决策模型,结合GCM-Arc控制方法与深度Q网络,提出分层GCM-Arc控制方法,以实现控制模式自适应切换和参数自适应调整.数字仿真实验表明,所提出方法在牧羊任务时间、无人机总路程、羊群平均半径、单体离群率和牧羊任务成功率方面,明显优于经典的两种牧羊控制方法. 展开更多
关键词 牧羊控制 无人机 分层自主决策 深度Q网络 自适应 路径规划
原文传递
基于改进DQN的无人机三维路径规划研究
10
作者 孔建国 赵恬恬 +2 位作者 梁海军 刘晨宇 马珂昕 《舰船电子工程》 2025年第7期36-40,共5页
为了解决DQN在未知环境下无人机路径规划中存在收敛性差及成功率较低的问题,提出了一种基于NoisyNet-DuelingDQN的路径规划方法。该方法在传统的DQN算法基础上引入了竞争网络,以更好地评估每一动作的价值;其次,通过给神经网络的权重引... 为了解决DQN在未知环境下无人机路径规划中存在收敛性差及成功率较低的问题,提出了一种基于NoisyNet-DuelingDQN的路径规划方法。该方法在传统的DQN算法基础上引入了竞争网络,以更好地评估每一动作的价值;其次,通过给神经网络的权重引入噪声,从而可以更好地探索空间,寻找最优策略。最后通过仿真实验证明:1)该算法在不同环境下相比传统的DQN和NoisyNet-DQN算法具有更好的收敛性和更高的奖励值;2)经60000次后,该算法成功率较DQN提高12.16%,较NoisyNet-DQN提高3.6%。 展开更多
关键词 深度强化学习 路径规划 dqn算法 NoisyNet-Duelingdqn
在线阅读 下载PDF
基于ROS仿真系统的DQN算法改进
11
作者 逄焕利 刘增福 赵景辉 《长春工业大学学报》 2025年第2期163-170,共8页
针对DQN算法收敛速度慢的问题进行优化,提出了DP-DQN算法,并将其应用于移动无人车,以学习最佳的决策。首先在Dueling DQN的基础上改进其网络结构,将网络结构分解为价值函数和优势函数,从而实现了动作选择和动作评价的解耦,加快了收敛速... 针对DQN算法收敛速度慢的问题进行优化,提出了DP-DQN算法,并将其应用于移动无人车,以学习最佳的决策。首先在Dueling DQN的基础上改进其网络结构,将网络结构分解为价值函数和优势函数,从而实现了动作选择和动作评价的解耦,加快了收敛速度,使其具有更好的泛化性能,能够更快地学习最优决策。其次,加入优先经验回放机制,提高样本利用率。最后针对训练阶段的不稳定性和环境状态空间的稀疏性,在DQN的即时奖励基础上增加了缩放日志策略,使无人车进行更多的探索。仿真实验结果表明,该方法在静态无障碍环境下均比DQN、Dueling DQN具有更高的学习效率和更快的收敛,该无人车能够在未知动态环境下成功到达局部目标位置。 展开更多
关键词 DP-dqn dqn Dueling dqn 优先经验回放
在线阅读 下载PDF
基于DQN的智能农机路径跟踪控制研究 被引量:4
12
作者 杨琰 张瑞瑞 +4 位作者 张林焕 陈立平 伊铜川 吴明齐 岳晓龙 《农机化研究》 北大核心 2025年第3期28-34,共7页
针对复杂路面条件下无人化农业作业车辆路径跟踪控制精度低、控制器参数整定困难的问题,设计了一种基于深度强化学习的路径跟踪控制算法。基于五层BP神经网络构建了DQN(Deep Q-Network)路径跟踪控制器,实现了网络的轻量化和高度的可移... 针对复杂路面条件下无人化农业作业车辆路径跟踪控制精度低、控制器参数整定困难的问题,设计了一种基于深度强化学习的路径跟踪控制算法。基于五层BP神经网络构建了DQN(Deep Q-Network)路径跟踪控制器,实现了网络的轻量化和高度的可移植性。控制器网络的输入状态在采用车辆当前舵角、车辆与目标路径上控制点间横向距离偏差的基础上,引入车辆前方设定距离内的平均路径曲率,实现了车辆转向性能的提高。分别开展了仿真和田间试验,验证了所设计深度强化学习网络算法的收敛性,并对比了有路径曲率输入和无路径曲率输入两种网络的路径跟踪控制性能。仿真试验中,基于正弦曲线对两种路径跟踪控制方法进行训练,两种路径跟踪控制网络收敛后的平均跟踪距离误差为0.008 4、0.017 7 m。在间隔6 m的U型路径上进行田间测试试验,结果显示:有路径曲率输入的模型性能显著优于无路径曲率输入的模型,两种路径跟踪控制方法在路径上平均跟踪距离误差为0.038 9、0.068 4 m。验证了该路径跟踪控制方法有效性,可满足农业作业车辆路径跟踪控制需求。 展开更多
关键词 路径跟踪 深度强化学习 dqn 路径曲率 智能农机
在线阅读 下载PDF
基于改进DQN的Kinova三指机械臂抓取策略优化
13
作者 韩玉兰 李聪 +1 位作者 柳子涵 田旭航 《物联网技术》 2025年第23期52-58,共7页
针对深度Q网络(DQN)在复杂控制任务实施过程中面临的Q值估计过高、计算复杂、记忆功能缺失和探索不足等问题,提出一种改进的DQN模型,旨在提升Kinova三指机械臂的抓取性能。在PyBullet仿真环境中获取动态图像输入,并引入门控循环单元(GRU... 针对深度Q网络(DQN)在复杂控制任务实施过程中面临的Q值估计过高、计算复杂、记忆功能缺失和探索不足等问题,提出一种改进的DQN模型,旨在提升Kinova三指机械臂的抓取性能。在PyBullet仿真环境中获取动态图像输入,并引入门控循环单元(GRU)以捕捉和处理时间序列信息,从而增强模型对历史状态的记忆能力。同时,采用NoisyLinear层替代传统epsilon-greedy策略中的随机噪声,显著提升了策略的探索效率与多样性。在模型训练过程中,结合噪声线性探索机制和经验回放机制,实验结果表明,改进后的模型可显著提高机械臂的抓取成功率。 展开更多
关键词 dqn GRU Q值 NoisyLinear 机械臂抓取 经验回放
在线阅读 下载PDF
复杂环境下基于TCP-DQN算法的低空飞行器动态航路规划 被引量:1
14
作者 许振阳 陈谋 +1 位作者 韩增亮 邵书义 《机器人》 北大核心 2025年第3期383-393,共11页
针对深度强化学习算法在解决低空飞行器动态航路规划时出现的训练效率低、收敛速度慢以及航路可飞性差等问题,提出了一种基于目标导向课程学习和优先经验回放策略的深度Q网络(TCP-DQN)动态航路规划算法。首先,在强化学习算法框架中引入... 针对深度强化学习算法在解决低空飞行器动态航路规划时出现的训练效率低、收敛速度慢以及航路可飞性差等问题,提出了一种基于目标导向课程学习和优先经验回放策略的深度Q网络(TCP-DQN)动态航路规划算法。首先,在强化学习算法框架中引入课程学习机制,通过设置目标引导机动策略,在提高算法训练速度的同时优化所规划航路的可飞性。其次,构建训练组合奖励函数以解决DQN奖励值稀疏问题,并通过优先回放低空飞行器避障经验来提高算法的学习效果。最后,给出了TCP-DQN算法在3维低空动态环境下的航路规划仿真结果。仿真结果表明,该算法能够快速地为低空飞行器在动态未知威胁环境中规划出安全高效的飞行航路。 展开更多
关键词 低空飞行器 深度强化学习 动态航路规划 dqn算法
原文传递
基于DQN的快速路合流区CAV换道决策方法 被引量:1
15
作者 程国柱 王文志 +1 位作者 陈永胜 徐亮 《哈尔滨工业大学学报》 北大核心 2025年第3期98-109,共12页
为解决快速路合流区的交通拥堵和安全问题,保障智能网联车辆(connected and automated vehicle,CAV)在快速路合流区高效、安全、舒适、稳定地行驶,采用深度强化学习方法之DQN(deep q-network)算法,综合考虑车辆行驶安全性、高效性与舒... 为解决快速路合流区的交通拥堵和安全问题,保障智能网联车辆(connected and automated vehicle,CAV)在快速路合流区高效、安全、舒适、稳定地行驶,采用深度强化学习方法之DQN(deep q-network)算法,综合考虑车辆行驶安全性、高效性与舒适性等因素,建立了用于神经网络训练的奖励函数模型,提出了快速路合流区CAV换道决策方法。应用开源自动驾驶仿真场景highway-env,搭建快速路合流区仿真环境,对其主线路段及匝道进行仿真试验。仿真试验结果表明:相比于智能驾驶人模型(intelligent driver model,IDM)和highway-env中换道决策方法,采用所提出的快速路合流区CAV换道决策方法时,CAV能够快速达到22.22 m/s行驶的稳定状态,同时避免频繁换道及加减速行为,并优化了车头时距,很大程度上提高了交通流运行效率和乘车舒适性。研究成果在智能交通领域中,可为智能网联环境下城市快速路合流区的车辆通行提供了一种新方法,为未来智能网联车辆的换道提供了决策方法。 展开更多
关键词 智能交通 CAV换道决策方法 dqn 智能网联车辆 深度强化学习 快速路合流区
在线阅读 下载PDF
一种基于DQN的卫星通信车载站中频功率智能控制方法 被引量:1
16
作者 黄启明 袁正林 +1 位作者 龚正伟 宋军 《电讯技术》 北大核心 2025年第7期1120-1128,共9页
针对传统卫星通信车载站中频信号功率控制策略中存在的自动化程度低、控制效率低下等问题,提出了一种基于深度Q学习网络(Deep Q-learning Network,DQN)的功率智能控制方法。将功率控制决策转化成一个马尔可夫决策过程:选取信道终端设备(... 针对传统卫星通信车载站中频信号功率控制策略中存在的自动化程度低、控制效率低下等问题,提出了一种基于深度Q学习网络(Deep Q-learning Network,DQN)的功率智能控制方法。将功率控制决策转化成一个马尔可夫决策过程:选取信道终端设备(Channel Terminal,CT)参数构建状态空间,以终端链路操作和禁呼时间构建动作空间,设计了基于业务价值的奖励函数和基于物理特性的状态转移函数。提出的控制策略实现了中频信号功率控制智能化,算法收敛状态平均回报可以达到主流深度强化学习算法水平,平均回合训练时间仅为对照组最长时间的6.45%。 展开更多
关键词 卫星通信车载站 中频功率控制 深度Q学习网络(dqn)
在线阅读 下载PDF
基于DQN的无人机主动捕捉拦阻回收方法
17
作者 王一峰 彭一明 +2 位作者 李龙 魏小辉 聂宏 《航空学报》 北大核心 2025年第12期226-239,共14页
使用拦阻索回收无人机时,钩索成功率是评估其回收安全性与可靠性的关键指标之一。针对无人机回收区域受限的情况下如何提高钩索成功率这一问题,提出了一种无人机主动捕捉拦阻回收方法,通过在车载移动平台的拦阻系统在人工智能计算结果... 使用拦阻索回收无人机时,钩索成功率是评估其回收安全性与可靠性的关键指标之一。针对无人机回收区域受限的情况下如何提高钩索成功率这一问题,提出了一种无人机主动捕捉拦阻回收方法,通过在车载移动平台的拦阻系统在人工智能计算结果的引导下主动移动至最佳钩索位置来提高无人机的钩索成功率。首先,建立无人机着陆回收拦阻动力学模型来计算钩索失效边界,使用支持向量机(SVM)方法对动力学仿真结果进行识别,并生成无人机钩索分析代理模型。然后,将移索过程简化成马尔可夫决策过程,使用移索装置模型作为训练环境,六自由度无人机着陆下滑模型生成数据集,钩索分析代理模型构成奖励函数,采用深度Q网络(DQN)训练得到能够实时计算并引导拦阻装置向最佳钩索位置主动调整的移索策略。仿真结果显示,在回收空间受限的情况下,与传统被动式拦阻回收方法相比,使用主动捕捉拦阻方法钩索成功率提高了29%。该方法有效提高了无人机着陆回收的安全性和可靠性,为智能化回收技术的发展提供了新的理论支持和实践方案。 展开更多
关键词 固定翼无人机 着陆回收 钩索成功率 dqn 人工智能
原文传递
基于改进DQN的直升机CGF突防路径规划 被引量:2
18
作者 许强强 李克奇 +2 位作者 岳忠奇 杨艳良 岳晋忠 《火力与指挥控制》 北大核心 2025年第1期104-112,共9页
针对直升机CGF突防雷达阵地时的路径规划问题,提出了一种基于改进DQN的直升机CGF的突防路径规划方法。结合了人工势场原理和专家经验,对传统的深度强化学习DQN算法进行了多方面的改进,以适应动态和不可预知的战场环境。通过在MetaSim仿... 针对直升机CGF突防雷达阵地时的路径规划问题,提出了一种基于改进DQN的直升机CGF的突防路径规划方法。结合了人工势场原理和专家经验,对传统的深度强化学习DQN算法进行了多方面的改进,以适应动态和不可预知的战场环境。通过在MetaSim仿真作战平台中进行实验,证明该方法在路径规划的平均所需时间上比传统A*和DIJKSTRA算法以及传统DQN算法有所提高,同时在路径长度和成功率上也显示出显著的改进。 展开更多
关键词 路径规划 计算机生成兵力 深度强化学习 人工势场 dqn
在线阅读 下载PDF
基于随机博弈和DQN算法的云原生移动目标防御决策方法
19
作者 耿致远 许泽轩 张恒巍 《信息网络安全》 北大核心 2025年第6期967-976,共10页
随着云原生系统中集成应用组件的复杂性不断提高,且大部分组件为开源代码,系统组件的漏洞利用已成为影响云原生安全的主要威胁之一。移动目标防御作为一种先进的动态防御机制,被广泛认为是应对该问题的有效手段。然而,在实际应用中,频... 随着云原生系统中集成应用组件的复杂性不断提高,且大部分组件为开源代码,系统组件的漏洞利用已成为影响云原生安全的主要威胁之一。移动目标防御作为一种先进的动态防御机制,被广泛认为是应对该问题的有效手段。然而,在实际应用中,频繁且无序的配置转换可能会使系统运行效率和服务质量降低,进而对资源有限系统的安全性造成不利影响。为解决云原生环境中随机攻防场景下的移动目标防御决策问题,文章结合博弈理论的建模能力与深度强化学习的求解优势,提出一种基于随机博弈和DQN算法的云原生移动目标防御决策方法,实现在大规模策略空间中进行高效最优移动目标防御策略的决策,并通过仿真实验验证了文章所提方法的有效性和实用性。 展开更多
关键词 云原生 漏洞利用 移动目标防御 随机博弈 dqn算法
在线阅读 下载PDF
基于DQN算法的决策和执行分离的交通信号控制
20
作者 谢梦伟 陈光 +2 位作者 汪洋 胡鸿翔 侯北平 《浙江科技大学学报》 2025年第5期526-536,共11页
【目的】为了解决交通信号强化学习控制中相位决策即执行机制可能带来的交通安全隐患问题,提出一种相位决策和执行分离的深度强化学习交通信号控制方法。【方法】首先,引入相位决策和执行分离的策略,在当前交通信号相位持续时间临近结... 【目的】为了解决交通信号强化学习控制中相位决策即执行机制可能带来的交通安全隐患问题,提出一种相位决策和执行分离的深度强化学习交通信号控制方法。【方法】首先,引入相位决策和执行分离的策略,在当前交通信号相位持续时间临近结束的过渡期,智能体(交通信号控制器)基于道路交叉口的实时车流状况信息做出下一相位决策,并在当前相位持续时间结束时执行下一相位,以此在相位决策和执行的过渡期引入信号预警;然后,在深度Q网络(deep Q-network,DQN)强化学习的框架上设计并实现算法;最后,搭建仿真试验环境对算法进行验证。【结果】过渡期时长为5 s时,本研究提出的方法在多种交通流量条件下均表现优异,与DQN控制策略相比,本研究方法在高、中、低及混合车流量场景中车辆平均行驶时间分别减少3.58%、9.85%、12.19%和3.44%,在高、中、低车流量场景中平均等待时间分别减少7.35%、13.92%和45.36%,在混合车流量场景中无明显优势;相较于竞争架构深度Q-network(dueling deep Q-network,Dueling DQN)控制策略,车辆平均行驶时间分别降低3.09%、7.74%、16.25%和25.15%,平均等待时间分别降低5.24%、10.96%、51.94%和57.87%;与柔性演员-评论家(soft actor-critic,SAC)控制策略相比,车辆平均行驶时间分别降低7.86%、14.19%、24.01%和9.50%,平均等待时间分别降低22.94%、28.47%、63.50%和12.17%。【结论】本研究有效提高了车辆通行效率,同时通过在相位切换过渡期引入信号预警,使驾驶者能够提前知晓信号变化,避免做出错误决策,从而减少交通安全隐患,对实现智能交通和交通安全有现实意义。 展开更多
关键词 交通信号控制 深度强化学习 dqn 决策和执行分离
在线阅读 下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部