期刊文献+
共找到75篇文章
< 1 2 4 >
每页显示 20 50 100
Automatic Driving Operation Strategy of Urban Rail Train Based on Improved DQN Algorithm
1
作者 Tian Lu Bohong Liu 《Journal on Artificial Intelligence》 2023年第1期113-129,共17页
To realize a better automatic train driving operation control strategy for urban rail trains,an automatic train driving method with improved DQN algorithm(classical deep reinforcement learning algorithm)is proposed as... To realize a better automatic train driving operation control strategy for urban rail trains,an automatic train driving method with improved DQN algorithm(classical deep reinforcement learning algorithm)is proposed as a research object.Firstly,the train control model is established by considering the train operation requirements.Secondly,the dueling network and DDQN ideas are introduced to prevent the value function overestimation problem.Finally,the priority experience playback and“restricted speed arrival time”are used to reduce the useless experience utilization.The experiments are carried out to verify the train operation strategy method by simulating the actual line conditions.From the experimental results,the train operation meets the ATO requirements,the energy consumption is 15.75%more energy-efficient than the actual operation,and the algorithm convergence speed is improved by about 37%.The improved DQN method not only enhances the efficiency of the algorithm but also forms a more effective operation strategy than the actual operation,thereby contributing meaningfully to the advancement of automatic train operation intelligence. 展开更多
关键词 dqn algorithm automatic train operation(ATO) operation strategy urban rail train
在线阅读 下载PDF
基于DQN算法的直流微电网负载接口变换器自抗扰控制策略 被引量:1
2
作者 周雪松 韩静 +3 位作者 马幼捷 陶珑 问虎龙 赵明 《电力系统保护与控制》 北大核心 2025年第1期95-103,共9页
在直流微电网中,为了保证直流母线与负载之间能量流动的稳定性,解决在能量流动中不确定因素产生的扰动问题。在建立DC-DC变换器数学模型的基础上,设计了一种基于深度强化学习的DC-DC变换器自抗扰控制策略。利用线性扩张观测器对总扰动... 在直流微电网中,为了保证直流母线与负载之间能量流动的稳定性,解决在能量流动中不确定因素产生的扰动问题。在建立DC-DC变换器数学模型的基础上,设计了一种基于深度强化学习的DC-DC变换器自抗扰控制策略。利用线性扩张观测器对总扰动的估计补偿和线性误差反馈控制特性对自抗扰控制器结构进行简化设计,并结合深度强化学习对其控制器参数进行在线优化。根据不同工况下的负载侧电压波形,分析了DC-DC变换器在该控制策略、线性自抗扰控制与比例积分控制下的稳定性、抗扰性和鲁棒性,验证了该控制策略的正确性和有效性。最后,在参数摄动下进行了蒙特卡洛实验,仿真结果表明该控制策略具有较好的鲁棒性。 展开更多
关键词 直流微电网 深度强化学习 dqn算法 DC-DC变换器 线性自抗扰控制
在线阅读 下载PDF
基于改进DQN算法的船舶全局路径规划研究
3
作者 关巍 曲胜 +1 位作者 张显库 胡彤博 《中国舰船研究》 北大核心 2025年第1期107-114,共8页
[目的]为提升实际海域环境下船舶航行路径的经济性与安全性,提出一种改进深度Q网络(DQN)算法的船舶全局路径规划方法。[方法]首先,引入优先经验回放机制赋予重要样本更高的权重,提升学习效率;然后,再通过决斗网络和噪声网络改进DQN的网... [目的]为提升实际海域环境下船舶航行路径的经济性与安全性,提出一种改进深度Q网络(DQN)算法的船舶全局路径规划方法。[方法]首先,引入优先经验回放机制赋予重要样本更高的权重,提升学习效率;然后,再通过决斗网络和噪声网络改进DQN的网络结构,使其对特定状态及其动作的价值评估更加准确,并同时具备一定的探索性和泛化性。[结果]实验结果表明,在马尼拉附近海域环境下,相比于A^(*)算法和DQN算法,改进算法在路径长度上分别缩短了1.9%和1.0%,拐点数量上分别减少了62.5%和25%。[结论]实验结果验证了改进DQN算法能够更经济、更合理地规划出有效路径。 展开更多
关键词 船舶 运动规划 dqn算法 优先经验回放(PER)
在线阅读 下载PDF
基于DQN和圆拟合的机器人手眼标定方法
4
作者 储昭碧 何沣奕 +1 位作者 高金辉 彭乐峰 《仪器仪表学报》 北大核心 2025年第8期330-340,共11页
近年来,随着工业机器人技术的不断发展,机器人搭载激光测距仪实现多姿态测量的应用场景和对手眼标定的需求逐渐增多,对手眼标定技术的精度提出了更高要求,而传统标定方法往往依赖专用标定物或传感器,操作复杂且成本较高。故提出了一种... 近年来,随着工业机器人技术的不断发展,机器人搭载激光测距仪实现多姿态测量的应用场景和对手眼标定的需求逐渐增多,对手眼标定技术的精度提出了更高要求,而传统标定方法往往依赖专用标定物或传感器,操作复杂且成本较高。故提出了一种基于深度Q网络(DQN)算法和圆轮廓拟合的机器人手眼标定方法。利用DQN算法控制机器人末端两关节带动激光测距仪运动,使得激光测距仪返回值最小,在此基础上,建立机械臂运动学模型计算得到此时光点的理论坐标值。通过设定关节一的多个角度值,使光点在目标平面形成一个圆轨迹,对实际采集的光点坐标值进行圆拟合,建立等式约束下的优化模型,求解得到手眼标定的参数值。基于MATLAB平台模拟仿真,对该方法的可行性进行了验证,分析了角度参数和位移参数初始值对标定结果的影响和抗激光测距噪声干扰的性能。与其他标定方法进行对比,结果显示该方法具有更高的精度。搭建了实验系统,利用该方法求解标定参数,实验结果表明,标定后的系统扫描实验误差不大于0.5 mm,满足工业应用的精度要求。该方法无需额外昂贵的标定物,仅依靠激光测距仪的单测量量和几何约束,显著降低了标定成本与操作难度,同时具备良好的抗噪声性能,能实现工业现场高精度标定。 展开更多
关键词 手眼标定 强化学习 dqn算法 圆拟合
原文传递
基于改进DQN的无人机三维路径规划研究
5
作者 孔建国 赵恬恬 +2 位作者 梁海军 刘晨宇 马珂昕 《舰船电子工程》 2025年第7期36-40,共5页
为了解决DQN在未知环境下无人机路径规划中存在收敛性差及成功率较低的问题,提出了一种基于NoisyNet-DuelingDQN的路径规划方法。该方法在传统的DQN算法基础上引入了竞争网络,以更好地评估每一动作的价值;其次,通过给神经网络的权重引... 为了解决DQN在未知环境下无人机路径规划中存在收敛性差及成功率较低的问题,提出了一种基于NoisyNet-DuelingDQN的路径规划方法。该方法在传统的DQN算法基础上引入了竞争网络,以更好地评估每一动作的价值;其次,通过给神经网络的权重引入噪声,从而可以更好地探索空间,寻找最优策略。最后通过仿真实验证明:1)该算法在不同环境下相比传统的DQN和NoisyNet-DQN算法具有更好的收敛性和更高的奖励值;2)经60000次后,该算法成功率较DQN提高12.16%,较NoisyNet-DQN提高3.6%。 展开更多
关键词 深度强化学习 路径规划 dqn算法 NoisyNet-Duelingdqn
在线阅读 下载PDF
基于随机博弈和DQN算法的云原生移动目标防御决策方法
6
作者 耿致远 许泽轩 张恒巍 《信息网络安全》 北大核心 2025年第6期967-976,共10页
随着云原生系统中集成应用组件的复杂性不断提高,且大部分组件为开源代码,系统组件的漏洞利用已成为影响云原生安全的主要威胁之一。移动目标防御作为一种先进的动态防御机制,被广泛认为是应对该问题的有效手段。然而,在实际应用中,频... 随着云原生系统中集成应用组件的复杂性不断提高,且大部分组件为开源代码,系统组件的漏洞利用已成为影响云原生安全的主要威胁之一。移动目标防御作为一种先进的动态防御机制,被广泛认为是应对该问题的有效手段。然而,在实际应用中,频繁且无序的配置转换可能会使系统运行效率和服务质量降低,进而对资源有限系统的安全性造成不利影响。为解决云原生环境中随机攻防场景下的移动目标防御决策问题,文章结合博弈理论的建模能力与深度强化学习的求解优势,提出一种基于随机博弈和DQN算法的云原生移动目标防御决策方法,实现在大规模策略空间中进行高效最优移动目标防御策略的决策,并通过仿真实验验证了文章所提方法的有效性和实用性。 展开更多
关键词 云原生 漏洞利用 移动目标防御 随机博弈 dqn算法
在线阅读 下载PDF
基于树采样Dueling-DQN的无人机三维避障路径规划方案
7
作者 胡明 曹圣昊 +3 位作者 王杨 范祥祥 于得水 焦奕康 《小型微型计算机系统》 北大核心 2025年第7期1616-1624,共9页
深度Q网络(Deep Q-Network, DQN)已被广泛应用于无人机避障路径规划任务,针对传统DQN采样过程中由于存在样本信息利用不充分,导致收敛速度慢的问题,提出了一种基于树采样Dueling-DQN的无人机三维避障路径规划方案.首先描述了三维空间内... 深度Q网络(Deep Q-Network, DQN)已被广泛应用于无人机避障路径规划任务,针对传统DQN采样过程中由于存在样本信息利用不充分,导致收敛速度慢的问题,提出了一种基于树采样Dueling-DQN的无人机三维避障路径规划方案.首先描述了三维空间内的无人机避障规划网络系统模型、仿真环境模型;然后设计了避障算法、电量消耗算法、无人机动作合集等;最后提出结合树采样的Dueling-DQN算法,算法使用二叉树结构存储优先级样本,结合奖励函数、贪婪策略等获得无人机的避障飞行路径.实验结果显示,与传统DQN和DDQN(Double Deep Q-Network, DDQN)相比,方案在获得较优规划路径的同时,取得了最高的平均奖励值.在10种障碍物难度等级的条件下,与A~*、RRT、蚁群算法相比,到达目标点所需的步数最少,且碰撞概率最低.仿真结果验证了所提无人机三维避障路径规划方案在处理三维空间内无人机避障规划问题的有效性. 展开更多
关键词 无人机 三维空间避障 路径规划 树采样 dqn算法
在线阅读 下载PDF
基于DQN的低轨卫星网络多目标智能路由算法
8
作者 罗宗屹 金世超 +1 位作者 董涛 殷杰 《天地一体化信息网络》 2025年第1期16-23,共8页
近年来,低轨卫星网络发展迅速,被广泛应用于全球通信、互联网接入等领域。首先,对当前低轨卫星网络发展现状与主流的低轨网络路由算法进行总结。然后,针对星上路由算法设计面临的优化目标单一、收敛速度慢以及时延和丢包率等指标优化难... 近年来,低轨卫星网络发展迅速,被广泛应用于全球通信、互联网接入等领域。首先,对当前低轨卫星网络发展现状与主流的低轨网络路由算法进行总结。然后,针对星上路由算法设计面临的优化目标单一、收敛速度慢以及时延和丢包率等指标优化难度大等挑战,提出基于深度Q网络(DQN)的多目标智能路由算法,通过设计多目标奖励函数,实现了时延、丢包率、负载均衡多目标的性能优化。在时延方面,本算法优于最短通路优先算法;在流量分布指数和丢包率方面,本算法相较于最短通路优先算法与Dijkstra算法分别提高14%和10%以上。最后,阐述所提智能路由算法在多种应用场景中的使用方法。 展开更多
关键词 低轨卫星网络 路由算法 深度Q网络
在线阅读 下载PDF
复杂环境下基于TCP-DQN算法的低空飞行器动态航路规划
9
作者 许振阳 陈谋 +1 位作者 韩增亮 邵书义 《机器人》 北大核心 2025年第3期383-393,共11页
针对深度强化学习算法在解决低空飞行器动态航路规划时出现的训练效率低、收敛速度慢以及航路可飞性差等问题,提出了一种基于目标导向课程学习和优先经验回放策略的深度Q网络(TCP-DQN)动态航路规划算法。首先,在强化学习算法框架中引入... 针对深度强化学习算法在解决低空飞行器动态航路规划时出现的训练效率低、收敛速度慢以及航路可飞性差等问题,提出了一种基于目标导向课程学习和优先经验回放策略的深度Q网络(TCP-DQN)动态航路规划算法。首先,在强化学习算法框架中引入课程学习机制,通过设置目标引导机动策略,在提高算法训练速度的同时优化所规划航路的可飞性。其次,构建训练组合奖励函数以解决DQN奖励值稀疏问题,并通过优先回放低空飞行器避障经验来提高算法的学习效果。最后,给出了TCP-DQN算法在3维低空动态环境下的航路规划仿真结果。仿真结果表明,该算法能够快速地为低空飞行器在动态未知威胁环境中规划出安全高效的飞行航路。 展开更多
关键词 低空飞行器 深度强化学习 动态航路规划 dqn算法
原文传递
基于DQN算法的动态调度问题研究
10
作者 周荣升 王艳红 《微处理机》 2025年第1期55-59,共5页
针对动态作业车间调度中新工件突发插入导致现有调度规则失效的问题,本文基于深度强化学习中的DQN算法提出一种实时调度策略。该方法可在动态环境下对调度决策进行实时调整,以实现整体生产效率最大化和新工件及时加工的目标。研究通过... 针对动态作业车间调度中新工件突发插入导致现有调度规则失效的问题,本文基于深度强化学习中的DQN算法提出一种实时调度策略。该方法可在动态环境下对调度决策进行实时调整,以实现整体生产效率最大化和新工件及时加工的目标。研究通过构建动态仿真环境,对算法在不同工件插入场景下的性能进行了验证,结果表明该方法相比传统调度方法具有更好的适应性和鲁棒性,为解决动态作业车间调度问题提供了新的思路。 展开更多
关键词 动态作业车间 dqn算法 强化学习 车间调度
在线阅读 下载PDF
基于DQN的改进NSGA-Ⅱ求解多目标柔性作业车间调度问题
11
作者 郑国梁 张朝阳 +1 位作者 吉卫喜 于俊杰 《现代制造工程》 北大核心 2025年第9期1-11,共11页
提出了一种基于深度Q网络(Deep Q-Network,DQN)改进的非支配排序遗传算法(Non-dominated Sorting Genetic AlgorithmⅡ,NSGA-Ⅱ),以解决以最小化最大完工时间和最小化能源消耗为目标的多目标柔性作业车间调度问题(Multi-Objective Flexi... 提出了一种基于深度Q网络(Deep Q-Network,DQN)改进的非支配排序遗传算法(Non-dominated Sorting Genetic AlgorithmⅡ,NSGA-Ⅱ),以解决以最小化最大完工时间和最小化能源消耗为目标的多目标柔性作业车间调度问题(Multi-Objective Flexible Job shop Scheduling Problem,MO-FJSP)。通过在DQN算法中定义马尔可夫决策过程和奖励函数,考虑选定设备对完工时间和能源消耗的局部及全局影响,提高了NSGA-Ⅱ初始种群的质量。改进的NSGA-Ⅱ通过精英保留策略确保运行过程中的种群多样性,并保留了进化过程中优质的个体。将DQN算法生成的初始解与贪婪算法生成的初始解进行对比,验证了DQN算法在生成初始解方面的有效性。此外,将基于DQN算法的改进NSGA-Ⅱ与其他启发式算法在标准案例和仿真案例上进行对比,证明了其在解决MO-FJSP方面的有效性。 展开更多
关键词 深度Q网络算法 多目标柔性作业车间调度问题 奖励函数 非支配排序遗传算法
在线阅读 下载PDF
基于DQN算法的考虑AGV小车搬运的离散制造车间调度方法 被引量:2
12
作者 周亚勤 肖蒙 +2 位作者 吕志军 汪俊亮 张洁 《机械工程学报》 EI CAS CSCD 北大核心 2024年第18期338-348,共11页
针对离散制造车间生产调度不仅需要确定工件各工序的加工设备及设备上工序的加工顺序,同时要根据工件调度方案,需要在规定时间点前由AGV小车将各工件运送到工序相应的设备上加工,以提高调度方案执行率的需求,构建考虑车间设备布局、工... 针对离散制造车间生产调度不仅需要确定工件各工序的加工设备及设备上工序的加工顺序,同时要根据工件调度方案,需要在规定时间点前由AGV小车将各工件运送到工序相应的设备上加工,以提高调度方案执行率的需求,构建考虑车间设备布局、工件工艺路线、AGV小车搬运时间与小车位置等约束,工件完工时间最小化和AGV小车运载均衡为综合目标的离散制造车间调度模型。依据离散制造车间调度数学模型构建强化学习环境,包括工件、机器和小车的状态空间,调度决策动作空间和奖励函数;基于建立的强化学习环境,设计基于DQN算法的工件小车调度方法,设计工件智能体,读取车间局部环境,将局部环境映射到工件状态参数的权重,根据该权重得到工件调度列表实现从车间状态到工件调度的动作选择。设计小车智能体,通过读取工件智能体调度决策和车间信息得到小车搬运相关参数,实现小车智能体与工件智能体的交互,将搬运相关参数和车间局部环境中小车状态信息映射成小车调度相关权重,根据权重得到小车调度列表实现小车调度的动作选择。最后,通过离散制造车间实际案例对算法进行测试,测试结果表明,基于DQN算法的调度算法能够有效地求解考虑小车搬运的离散制造车间调度问题,可最小化工件的最大完工时间,均衡小车的搬运负载,具有良好的综合调度性能。 展开更多
关键词 离散制造车间 工件调度 小车调度 dqn算法
原文传递
基于改进DQN算法的无人仓多AGV路径规划 被引量:2
13
作者 谢勇 郑绥君 +1 位作者 程念胜 朱洪君 《工业工程》 2024年第1期36-44,53,共10页
针对无人仓中多AGV路径规划与冲突问题,以最小化总行程时间为目标,建立多AGV路径规划模型,提出一种基于动态决策的改进DQN算法。算法设计了基于单AGV静态路径规划的经验知识模型,指导AGV的学习探索方向,提前规避冲突与障碍物,加快算法... 针对无人仓中多AGV路径规划与冲突问题,以最小化总行程时间为目标,建立多AGV路径规划模型,提出一种基于动态决策的改进DQN算法。算法设计了基于单AGV静态路径规划的经验知识模型,指导AGV的学习探索方向,提前规避冲突与障碍物,加快算法收敛。同时提出基于总行程时间最短的冲突消解策略,从根本上解决多AGV路径冲突与死锁问题。最后,建立无人仓栅格地图进行仿真实验。结果表明,本文提出的模型和算法较其他DQN算法收敛速度提升13.3%,平均损失值降低26.3%。这说明该模型和算法有利于规避和化解无人仓多AGV路径规划冲突,减少多AGV总行程时间,对提高无人仓作业效率具有重要指导意义。 展开更多
关键词 多AGV 路径规划 dqn算法 经验知识 冲突消解
在线阅读 下载PDF
子目标驱动DQN算法的无人车狭窄转弯环境导航 被引量:2
14
作者 耿玺钧 崔立堃 +1 位作者 熊高 刘知阳 《控制与决策》 EI CSCD 北大核心 2024年第11期3637-3644,共8页
针对无人车在狭窄的转弯工作环境下,传统导航存在无法构建地图或所构建地图障碍物膨胀半径过大以及定位和控制存在误差,从而导致无人车与障碍物相撞,无法有效完成导航任务的问题,首先,通过将A^(*)算法所生成的路径进行离散化,周期性选... 针对无人车在狭窄的转弯工作环境下,传统导航存在无法构建地图或所构建地图障碍物膨胀半径过大以及定位和控制存在误差,从而导致无人车与障碍物相撞,无法有效完成导航任务的问题,首先,通过将A^(*)算法所生成的路径进行离散化,周期性选取路径点作为深度强化学习算法的目标点的方法,设计子目标驱动DQN算法,并基于此建立深度神经网络;然后,采用软件搭建狭窄的转弯环境,使用所提出子目标驱动DQN算法、无子目标驱动的DQN算法、DDPG算法、SAC算法分别对无人车进行训练,通过对比4种算法的收敛速度、执行步数以及导航成功率,验证所提出子目标驱动DQN算法在完成狭窄转弯环境导航任务时,效果最好;最后,将所提出算法的训练结果移植到全新的、空间更小、弯数更多的测试场景中进行测试,表明无人车能够顺利完成导航任务,从而验证所提出子目标驱动DQN算法的高扩展性. 展开更多
关键词 A*算法 路径离散化 子目标驱动dqn算法 无人车 狭窄环境 导航
原文传递
未知环境下基于Dueling DQN的无人机路径规划研究 被引量:2
15
作者 赵恬恬 孔建国 +1 位作者 梁海军 刘晨宇 《现代计算机》 2024年第5期37-43,共7页
为有效解决无人机在未知环境下的路径规划问题,提出一种基于Dueling DQN的路径规划方法。首先,在DQN的基础上,引入对抗网络架构,从而更好地提高成功率;其次,设计状态空间并定义离散化的动作和适当的奖励函数以引导无人机学习最优路径;... 为有效解决无人机在未知环境下的路径规划问题,提出一种基于Dueling DQN的路径规划方法。首先,在DQN的基础上,引入对抗网络架构,从而更好地提高成功率;其次,设计状态空间并定义离散化的动作和适当的奖励函数以引导无人机学习最优路径;最后在仿真环境中对DQN和Dueling DQN展开训练,结果表明:①Dueling DQN能规划出未知环境下从初始点到目标点的无碰撞路径,且能获得更高的奖励值;②经过50000次训练,Dueling DQN的成功率比DQN提高17.71%,碰撞率减少1.57%,超过最长步长率降低16.14%。 展开更多
关键词 无人机 路径规划 深度强化学习 Dueling dqn算法
在线阅读 下载PDF
基于改进DQN的移动机器人避障路径规划 被引量:8
16
作者 田箫源 董秀成 《中国惯性技术学报》 EI CSCD 北大核心 2024年第4期406-416,共11页
针对一般强化学习方法下机器人在避障路径规划上学习时间长、探索能力差和奖励稀疏等问题,提出了一种基于改进深度Q网络(DQN)的移动机器人避障路径规划。首先在传统DQN算法基础上设计了障碍学习规则,避免对同一障碍重复学习,提升学习效... 针对一般强化学习方法下机器人在避障路径规划上学习时间长、探索能力差和奖励稀疏等问题,提出了一种基于改进深度Q网络(DQN)的移动机器人避障路径规划。首先在传统DQN算法基础上设计了障碍学习规则,避免对同一障碍重复学习,提升学习效率和成功率。其次提出奖励优化方法,利用状态间的访问次数差异给予奖励,平衡状态点的访问次数,避免过度访问;同时通过计算与目标点的欧氏距离,使其偏向于选择接近目标的路径,并取消远离目标惩罚,实现奖励机制的自适应优化。最后设计了动态探索因子函数,在后期训练中侧重利用强化学习策略选取动作和学习,提高算法性能和学习效率。实验仿真结果显示,与传统DQN算法相比,改进算法在训练时间上缩短了40.25%,避障成功率上提升了79.8%以及路径长度上缩短了2.25%,均体现了更好的性能。 展开更多
关键词 移动机器人 dqn算法 路径规划 避障 深度强化学习
在线阅读 下载PDF
基于DQN算法的农用无人车作业路径规划 被引量:1
17
作者 庄金炜 张晓菲 +1 位作者 尹琪东 陈克 《沈阳理工大学学报》 CAS 2024年第4期32-37,共6页
传统农用无人车作业时常依据人工经验确定作业路线,面对复杂的作业环境时无法保证路径规划的高效性,且传统覆盖路径规划方法聚焦于覆盖率而忽略了车辆作业路线上的损耗。为此,提出一种以减少车辆在路线上的损耗为目标的最优全局覆盖路... 传统农用无人车作业时常依据人工经验确定作业路线,面对复杂的作业环境时无法保证路径规划的高效性,且传统覆盖路径规划方法聚焦于覆盖率而忽略了车辆作业路线上的损耗。为此,提出一种以减少车辆在路线上的损耗为目标的最优全局覆盖路径规划方法。以深度Q网络(DQN)算法为基础,根据作业时车辆的真实轨迹创建奖励策略(RLP),对车辆在路线上的损耗进行优化,减少车辆的转弯数、掉头数及重复作业面积,设计了RLP-DQN算法。仿真实验结果表明,对比遗传算法、A~*算法等传统路径规划方法,本文RLP-DQN算法综合性能较好,可在实现全覆盖路径规划的同时有效减少路线损耗。 展开更多
关键词 农用无人车 路径规划 深度强化学习 dqn算法
在线阅读 下载PDF
基于DQN算法的泵站供水系统节能控制优化 被引量:4
18
作者 陈财会 张天宇 +3 位作者 黄健康 金典 王卓悦 张小磊 《净水技术》 CAS 2024年第4期60-67,127,共9页
针对手动调节泵站中水泵运行的转速和启停会造成严重的能量浪费问题,引入基于深度Q网络(deep Q-learning network,DQN)的强化学习算法,通过获取当前泵组运行的状态,自动优化水泵组工作时各个水泵的运行参数,在各个水泵均处于高效区的前... 针对手动调节泵站中水泵运行的转速和启停会造成严重的能量浪费问题,引入基于深度Q网络(deep Q-learning network,DQN)的强化学习算法,通过获取当前泵组运行的状态,自动优化水泵组工作时各个水泵的运行参数,在各个水泵均处于高效区的前提下,提高水泵组的整体效率。对水泵组状态优化问题分别进行了数学描述和马尔可夫决策过程描述。同时定义了水泵组运行时的状态空间、动作空间和即时奖励值,构建DQN网络,并以深圳市M水厂为算例,在由Gym构建的自定义仿真环境中进行验证。相较于人工调控,DQN算法调控降低了8.84%的损失能耗,一年可节省吨水电耗达1.27×10^(-2) kW·h/t,实现了节能减排,具有良好的经济效能。同时,DQN算法可通过在线学习的方式适应供水环境的变化,具有自主性、实时性、可推广性等优点。 展开更多
关键词 泵站供水 优化调度 dqn算法 马尔可夫决策过程 节能减排
在线阅读 下载PDF
基于DQN出价策略的多无人机目标分配拍卖算法 被引量:2
19
作者 陈梓豪 胡春鹤 《聊城大学学报(自然科学版)》 2024年第4期23-32,共10页
为实现多无人机监测目标分配任务匹配度、成功率等收益最大化及路径长度、障碍物碰撞风险等代价最小化,基于数据样本驱动的强化学习方法,提出了一种融合深度Q网络(Deep Q-network,DQN)出价策略的自主进化拍卖算法。首先,构建了多无人机... 为实现多无人机监测目标分配任务匹配度、成功率等收益最大化及路径长度、障碍物碰撞风险等代价最小化,基于数据样本驱动的强化学习方法,提出了一种融合深度Q网络(Deep Q-network,DQN)出价策略的自主进化拍卖算法。首先,构建了多无人机任务目标拍卖的马尔科夫决策模型,并且分别以竞拍者剩余竞拍容量为环境,输出增价因子为动作,前后两轮拍卖收益增幅为回报。其次,构建了新型的DQN出价和竞拍决策神经网络模型。该模型通过构建包含拍卖环境、增价因子、回报等元素的强化学习训练样本库,在拍卖过程中以一种离线学习模式不断训练DQN神经网络,使其按照DQN策略在拍卖过程中,根据拍卖环境输出增价因子,实现拍卖结果收益的优化。最后,通过多无人机多监测目标分配仿真,验证了所提出基于DQN拍卖机制的目标分配方法的有效性。通过与传统拍卖算法结果相比,方法获得的拍卖收益提升21.4%。 展开更多
关键词 多无人机 拍卖算法 dqn 多目标分配 拍卖收益
在线阅读 下载PDF
基于改进DQN算法的陶瓷梭式窑温度智能控制 被引量:1
20
作者 朱永红 余英剑 李蔓华 《中国陶瓷工业》 CAS 2024年第5期33-38,共6页
针对陶瓷梭式窑大延迟、非线性、慢时变及强耦合等特点,提出了基于改进DQN算法的陶瓷梭式窑温度智能控制方法。首先,建立了基于BP神经网络的陶瓷梭式窑模型。然后,提出了基于改进DQN算法的智能控制方法。最后,对所提出的方法进行了仿真... 针对陶瓷梭式窑大延迟、非线性、慢时变及强耦合等特点,提出了基于改进DQN算法的陶瓷梭式窑温度智能控制方法。首先,建立了基于BP神经网络的陶瓷梭式窑模型。然后,提出了基于改进DQN算法的智能控制方法。最后,对所提出的方法进行了仿真研究。仿真结果表明,改进的PRDQN算法的温度控制相对误差为0℃~5℃,温度控制效果相对较好。因此,所提出的方法是有效且可行的。 展开更多
关键词 陶瓷梭式窑 深度强化学习 BP神经网络 PRdqn算法
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部