期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于PER-DDPG算法的城市轨道交通越区切换研究
1
作者 张军平 王小鹏 王冶力 《山西电子技术》 2024年第3期100-102,共3页
针对传统IEEE802.11越区切换方式存在较高的切换延时以及乒乓切换等问题,提出深度强化学习(Deep Q-Network,DQN)越区切换算法。通过对列车运行的特征状态信息进行提取输入,考虑列车运行速度及场强、切换阈值等动态信息构建越区切换模型... 针对传统IEEE802.11越区切换方式存在较高的切换延时以及乒乓切换等问题,提出深度强化学习(Deep Q-Network,DQN)越区切换算法。通过对列车运行的特征状态信息进行提取输入,考虑列车运行速度及场强、切换阈值等动态信息构建越区切换模型。同时针对算法时间成本复杂度及稳定性,采用优先经验回放深度确定性策略梯度(Prioritized Experience Replay-Deep Deterministic Policy Gradient,PER-DDPG)算法,将列车状态空间信息传输至PER-DDPG网络中进行优化分析。结果表明基于PER-DDPG算法优化后的列车越区切换模型使用该算法时间计算成本降低,数据包传输延时约降低55%。 展开更多
关键词 基于通信列车控制 CBTC系统 IEEE802.11标准 优先经验回放机制深度确定策略梯度算法
在线阅读 下载PDF
基于DDPG-PER的智慧楼宇云边任务调度策略
2
作者 杨萍 赵俊睿 《自动化与仪表》 2026年第2期138-143,共6页
随着智慧楼宇中物联网终端激增,大量计算任务须上传处理,但云端延迟高且边缘算力有限。该文提出一种跨层联合优化框架,基于楼宇拓扑与业务特征,建立包含计算时延、任务优先级、云边计算与通信资源的联合调度模型。提出将SumTree结构的... 随着智慧楼宇中物联网终端激增,大量计算任务须上传处理,但云端延迟高且边缘算力有限。该文提出一种跨层联合优化框架,基于楼宇拓扑与业务特征,建立包含计算时延、任务优先级、云边计算与通信资源的联合调度模型。提出将SumTree结构的优先经验回放引入DDPG的DDPG-PER算法,提高样本利用率与收敛性。仿真实验显示,DDPG-PER在全局寻优、收敛速度与稳定性上优于标准DDPG及其他基线,并在最小化总体时延的同时优先完成高优先级任务,为智慧楼宇场景下的云边任务调度提供了一种有效的新思路。 展开更多
关键词 智慧楼宇 任务调度 资源分配 DDPG-PER
在线阅读 下载PDF
考虑空调系统的燃料电池汽车能量管理策略
3
作者 赵又群 徐周 +3 位作者 虞志浩 林棻 何鲲鹏 尤庆伸 《华南理工大学学报(自然科学版)》 北大核心 2025年第6期56-65,共10页
在燃料电池混合动力汽车的实际运行中,空调系统为驾驶员和乘客提供舒适的环境,然而空调系统的运行效果与汽车实际运行的能量分配相互影响,因此需要将空调系统考虑进能量管理策略,设计出在满足舱内温度舒适性要求的情况下,兼顾整车氢耗... 在燃料电池混合动力汽车的实际运行中,空调系统为驾驶员和乘客提供舒适的环境,然而空调系统的运行效果与汽车实际运行的能量分配相互影响,因此需要将空调系统考虑进能量管理策略,设计出在满足舱内温度舒适性要求的情况下,兼顾整车氢耗经济性的能量管理策略。首先在建立整车动力学模型的基础上,利用热平衡方程建立热泵空调系统模型和热负荷模型;然后采用结合了双Q网络和深度确定性策略梯度的优先经验采样的双延迟深度确定性策略梯度(TD3-PER)算法,建立考虑空调系统能耗与车辆运行需求的能量管理策略。在NEDC典型工况下进行仿真得出:TD3-PER能量管理策略下的空调系统能够使舱温在100s内迅速达到并维持在22~26℃的舒适范围内,满足制冷/制热的同时又保证车舱温度舒适,验证了考虑空调系统时TD3-PER能量管理策略的可行性;在空调系统制冷/制热时,相比传统的深度确定性策略梯度(DDPG)算法策略,基于TD3-PER算法策略的功率分配情况能够延长燃料电池和蓄电池使用寿命,且在制冷/制热时根据氢耗量分别可提高2.59和3.58个百分点的经济性,验证了基于TD3-PER算法能量管理策略在降低氢耗量、提高整车经济性方面相较于传统算法更具优势。 展开更多
关键词 双能源燃料电池汽车 空调系统 能量管理策略 TD3-PER DDPG
在线阅读 下载PDF
时变多参数不确定性下室内环境的节能控制
4
作者 赵建豪 宋华 +1 位作者 南新元 蔡鑫 《河北科技大学学报》 CAS 北大核心 2024年第6期597-608,共12页
为解决当前室内环境受多种时变参数影响不确定性较大,且现有控制设备无法根据室内环境对工作功率进行自适应调节造成的能源浪费问题,采用在深度确定性策略梯度(deep deterministic policy gradient,DDPG)中融入优先经验重放(prioritized... 为解决当前室内环境受多种时变参数影响不确定性较大,且现有控制设备无法根据室内环境对工作功率进行自适应调节造成的能源浪费问题,采用在深度确定性策略梯度(deep deterministic policy gradient,DDPG)中融入优先经验重放(prioritized experience replay,PER)的方法,合理优化控制设备功率,对室内空气质量(indoor air quality,IAQ)和热舒适度进行控制。结果表明:DDPG-PER算法能够在冬夏两季不同室外空气质量条件下,结合多时变参数,将室内环境控制在要求范围之内;与定风量控制系统相比,能源成本降低了13.30%,用户全年可节约2000元左右电费。研究结果对中国“碳中和”策略和绿色低碳建筑行业的发展具有一定的参考价值。 展开更多
关键词 环境质量监测与评价 强化学习 深度确定性策略梯度 优先经验重放 节能控制
在线阅读 下载PDF
车用电机定子电流新型优化控制方法
5
作者 周雅夫 王翰涛 连静 《机械设计与制造》 北大核心 2023年第3期230-233,238,共5页
为了实现交直轴电流最优匹配控制,提出了一种基于深度确定性策略梯度的车用电机定子电流优化控制方法。在不对交直轴耦合项电压进行补偿解耦的情况下实现IPMSM交直轴电流的最优匹配控制。实验分析表明基于DDPG的定子电流优化控制方法在... 为了实现交直轴电流最优匹配控制,提出了一种基于深度确定性策略梯度的车用电机定子电流优化控制方法。在不对交直轴耦合项电压进行补偿解耦的情况下实现IPMSM交直轴电流的最优匹配控制。实验分析表明基于DDPG的定子电流优化控制方法在优化交直轴电流匹配和最大转矩电流比控制方面优势显著。相比较传统的前馈补偿解耦(FFCDC)方法实现MTPA控制,同等定子电流产生转矩输出平均高出最高14%,实验验证进一步证明了DDPG具有优化交直轴电流最佳匹配和产生最大转矩输出的能力,验证了该方法的有效性。 展开更多
关键词 内置式永磁同步电机 最大转矩电流比 深度确定性策略梯度 交直轴电流最优匹配 定子电流优化控制
在线阅读 下载PDF
基于PER-PDDPG的无人机路径规划研究 被引量:4
6
作者 乔哲 黎思利 +1 位作者 王景志 符小卫 《无人系统技术》 2022年第6期12-23,共12页
针对未知复杂环境下的多无人机路径规划问题,提出了一种基于优先经验回放的并行深度确定性策略梯度(PER-PDDPG)算法。首先,该算法在传统深度强化学习算法和匈牙利算法的基础上,结合了优先经验回放机制与多智能体经验共享的特点,提高了... 针对未知复杂环境下的多无人机路径规划问题,提出了一种基于优先经验回放的并行深度确定性策略梯度(PER-PDDPG)算法。首先,该算法在传统深度强化学习算法和匈牙利算法的基础上,结合了优先经验回放机制与多智能体经验共享的特点,提高了经验的获取效率,并使高价值经验能够被更加充分的多次利用。其次,算法将针对单无人机的PER-DDPG算法并行拓展到多无人机中,使得算法的网络结构相对于传统多智能体强化学习算法更加简洁高效。仿真结果表明,该方法可以灵活应用于不同数量的无人机群中,并且相较于传统的多智能体强化学习算法拥有更快的收敛速度以及更高的收敛奖励均值,有效提升了在未知复杂环境下的多无人机路径规划效果。 展开更多
关键词 无人机 路径规划 深度强化学习 并行DDPG 优先经验回放
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部