期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
Coordinated Scheduling of Electric-Hydrogen-Heat Trigeneration System forLow-Carbon Building Based on Improved Reinforcement Learning
1
作者 Jiayun Ding Bin Chen +1 位作者 Yutong Lei Wei Zhang 《Energy Engineering》 2025年第11期4561-4577,共17页
In the field of low-carbon building systems,the combination of renewable energy and hydrogen energy systems is gradually gaining prominence.However,the uncertainty of supply and demand and the multi-energy flow coupli... In the field of low-carbon building systems,the combination of renewable energy and hydrogen energy systems is gradually gaining prominence.However,the uncertainty of supply and demand and the multi-energy flow coupling characteristics of this system pose challenges for its optimized scheduling.In light of this,this study focuses on electro-thermal-hydrogen trigeneration systems,first modelling the system's scheduling optimization problem as a Markov decision process,thereby transforming it into a sequential decision problem.Based on this,this paper proposes a reinforcement learning algorithm based on deep deterministic policy gradient improvement,aiming to minimize system operating costs and enhance the system's sustainable operation capability.Experimental results show that compared to traditional reinforcement learning algorithms,the reinforcement learning algorithm based on deep deterministic policy gradient improvement achieves improvements of 12.5%and 22.8%in convergence speed and convergence value,respectively.Additionally,under uncertainty scenarios ranging from 10%to 30%,cost reductions of 2.82%,3.08%,and 2.52%were achieved,respectively,with an average cost reduction of 2.80%across 30 simulated scenarios.Compared to the original algorithm and rule-based algorithms in multi-uncertainty environments,the reinforcement learning algorithm based on improved deep deterministic policy gradients demonstrated superiority in terms of system operating costs and continuous operational capability,effectively enhancing the system's economic and sustainable performance. 展开更多
关键词 TRIGENERATION low carbon building i-ddpg optimized scheduling
在线阅读 下载PDF
基于深度强化学习的堤坝巡检机器人避障方法
2
作者 张鹏程 胡宁宁 +2 位作者 王宵 左登勇 袁冬莉 《计算机测量与控制》 2025年第7期313-320,共8页
为解决复杂动态环境下的堤坝巡检机器人的自主避障问题,提出一种基于改进深度确定性策略梯度算法的巡检路径避障方法;为提高算法的收敛速度和稳定性,引入优先经验回放机制处理训练样本,并加入随机噪声提高算法对环境的探索能力;为解决... 为解决复杂动态环境下的堤坝巡检机器人的自主避障问题,提出一种基于改进深度确定性策略梯度算法的巡检路径避障方法;为提高算法的收敛速度和稳定性,引入优先经验回放机制处理训练样本,并加入随机噪声提高算法对环境的探索能力;为解决算法对环境缺乏先验知识,易于陷入局部迭代的问题,引入了人工势场法提高算法初始阶段的学习效率及快速收敛性;完成了改进算法的状态动作空间、奖励函数和避障训练流程设计;仿真结果表明,改进算法收敛速度快、规划的路径短,使巡检机器人具有更优越的避障能力;经实验验证算法实现了复杂环境下的自主动态避障。 展开更多
关键词 巡检机器人 深度强化学习 动态避障 堤坝巡检 改进DDPG算法
在线阅读 下载PDF
基于深度强化学习的综合能源系统优化调度
3
作者 梁海峰 闫峰 +1 位作者 尚隽 王楚通 《内蒙古电力技术》 2025年第4期21-29,共9页
为减少智能体达到收敛所需的训练轮数,提高经验样本利用效率,优化综合能源系统(Integrated Energy System,IES)能量调度,引入深度强化学习(Deep Reinforcement Learning,DRL)算法,提出一种基于多环境实例和数据特征分数经验采样机制的... 为减少智能体达到收敛所需的训练轮数,提高经验样本利用效率,优化综合能源系统(Integrated Energy System,IES)能量调度,引入深度强化学习(Deep Reinforcement Learning,DRL)算法,提出一种基于多环境实例和数据特征分数经验采样机制的改进深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法。首先,借助多环境实例促使智能体和环境进行大量交互,从而获得有效的指导经验;其次,对不同类型数据进行特征量化处理,并依据特征分数进行经验采样,提高样本利用效率;最后,将改进DDPG算法与经典柔性动作-评价(Soft Actor⁃Critic,SAC)算法、双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient,TD3)算法进行对比实验,实验结果验证了所提算法在提高收敛速度和样本利用效率方面的有效性,并通过算例仿真对模型增量学习后的性能提升进行了验证。 展开更多
关键词 综合能源系统 深度强化学习 改进深度确定性策略梯度算法 多环境实例 特征分数
在线阅读 下载PDF
基于联邦强化学习的电热综合能源系统能量管理策略
4
作者 王金锋 王琪 +3 位作者 任正某 孙晓晨 孙毅 赵一伊 《上海交通大学学报》 EI CAS CSCD 北大核心 2024年第6期904-915,共12页
电热综合能源系统(IES)的能量管理关系到园区的经济效益与多能互补能力,但面临新能源出力随机性和用户负荷不确定性的挑战.首先,构建电热IES能量管理问题的数学模型,将各供能子系统赋能为智能体,基于深度确定性策略梯度(DDPG)算法建立... 电热综合能源系统(IES)的能量管理关系到园区的经济效益与多能互补能力,但面临新能源出力随机性和用户负荷不确定性的挑战.首先,构建电热IES能量管理问题的数学模型,将各供能子系统赋能为智能体,基于深度确定性策略梯度(DDPG)算法建立综合考虑子系统实时用能负荷、分时电价及各设备出力的系统能量管理模型.然后,采用联邦学习技术,在训练过程中交互3个子系统的能量管理模型梯度参数对模型的训练效果进行协同优化,打破数据壁垒的同时保护各子系统数据隐私.最后,通过算例分析验证了所构建基于联邦学习框架的DDPG能量管理模型能有效提升园区IES经济效益. 展开更多
关键词 综合能源系统 联邦学习 能量管理 深度确定性策略梯度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部