期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
融入流体松弛模型的决斗双深度Q网络求解动态多重柔性作业车间调度问题
1
作者 杨晓宇 韩玉艳 +2 位作者 王玉亭 李寰 张彪 《控制理论与应用》 北大核心 2025年第11期2332-2340,共9页
鉴于生产过程中订单的随机到达可能导致调度方案无法实现最优,实时动态订单到达成为关键问题.针对动态多重柔性作业车间调度问题(DMFJSP),提出了多策略决斗双深度Q网络(MPD3QN)求解方法.该问题考虑了工件订单和多类型工件的动态到达,首... 鉴于生产过程中订单的随机到达可能导致调度方案无法实现最优,实时动态订单到达成为关键问题.针对动态多重柔性作业车间调度问题(DMFJSP),提出了多策略决斗双深度Q网络(MPD3QN)求解方法.该问题考虑了工件订单和多类型工件的动态到达,首先,为了降低DMFJSP的复杂性,提出了一个简化的流体松弛模型,并基于流体模型设计了多指标选择策略,用于辅助生产调度决策.其次,进一步构建了马尔可夫决策过程(MDP)模型,提取了与工件和机器相关的19个状态特征,设计了20种复合规则作为动作空间.然后,结合优先经验回放、软更新机制和自适应动作选择策略,提出了MPD3QN算法.最后,通过81个测试算例,将所提算法与3种现有的深度强化学习调度方法进行比较,仿真结果验证了其优越性. 展开更多
关键词 柔性制造系统 流体松弛模型 深度强化学习 多策略决斗双深度Q网络 多重性
在线阅读 下载PDF
基于单/多智能体简化强化学习的电力系统无功电压控制 被引量:17
2
作者 马庆 邓长虹 《电工技术学报》 EI CSCD 北大核心 2024年第5期1300-1312,共13页
为了快速平抑分布式能源接入系统产生的无功电压波动,以强化学习、模仿学习为代表的机器学习方法逐渐被应用于无功电压控制。虽然现有方法能实现在线极速求解,但仍然存在离线训练速度慢、普适性不够等阻碍其应用于实际的缺陷。该文首先... 为了快速平抑分布式能源接入系统产生的无功电压波动,以强化学习、模仿学习为代表的机器学习方法逐渐被应用于无功电压控制。虽然现有方法能实现在线极速求解,但仍然存在离线训练速度慢、普适性不够等阻碍其应用于实际的缺陷。该文首先提出一种适用于输电网集中式控制的单智能体简化强化学习方法,该方法基于“Actor-Critic”架构对强化学习进行简化与改进,保留了强化学习无需标签数据与强普适性的优点,同时消除了训练初期因智能体随机搜索造成的计算浪费,大幅提升了强化学习的训练速度;然后,提出一种适用于配电网分布式零通信控制的多智能体简化强化学习方法,该方法将简化强化学习思想推广形成多智能体版本,同时采用模仿学习进行初始化,将全局优化思想提前注入各智能体,提升各无功设备之间的就地协同控制效果;最后,基于改进IEEE 118节点算例的仿真结果验证了所提方法的正确性与快速性。 展开更多
关键词 无功电压控制 集中式控制 单智能体简化强化学习 分布式控制 多智能体简化强化学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部