为保证机床混流装配车间生产的机床准时交付,提出一种基于改进的深度多智能体强化学习的机床混流装配线调度优化方法,以解决最小延迟生产调度优化模型求解质量低、训练速度缓慢问题,构建以最小延迟时间目标的混流装配线调度优化模型,应...为保证机床混流装配车间生产的机床准时交付,提出一种基于改进的深度多智能体强化学习的机床混流装配线调度优化方法,以解决最小延迟生产调度优化模型求解质量低、训练速度缓慢问题,构建以最小延迟时间目标的混流装配线调度优化模型,应用去中心化分散执行的双重深度Q网络(double deep Q network,DDQN)的智能体来学习生产信息与调度目标的关系。该框架采用集中训练与分散执行的策略,并使用参数共享技术,能处理多智能体强化学习中的非稳态问题。在此基础上,采用递归神经网络来管理可变长度的状态和行动表示,使智能体具有处理任意规模问题的能力。同时引入全局/局部奖励函数,以解决训练过程中的奖励稀疏问题。通过消融实验,确定了最优的参数组合。数值实验结果表明,与标准测试方案相比,本算法在目标达成度方面,平均总延迟工件数较改善前提升了24.1%~32.3%,训练速度提高了8.3%。展开更多
为更好地提升食品企业综合效率,降低企业成本,针对考虑多工厂多客户场景下的生产配送集成调度问题(integrated production and distribution schedule,IPDS),建立最小化makespan和总成本为优化目标的多agent仿真模型,并提出一种改进的NS...为更好地提升食品企业综合效率,降低企业成本,针对考虑多工厂多客户场景下的生产配送集成调度问题(integrated production and distribution schedule,IPDS),建立最小化makespan和总成本为优化目标的多agent仿真模型,并提出一种改进的NSGA-Ⅱ算法进行求解。针对问题的两阶段集成特性,基于订单分配和加工顺序设计一种二维编码结构,采用仿真模型作为解码器解析各agent行为。在改进NGSA-Ⅱ算法中,采用随机和启发式规则结合的方式产生初始种群,根据问题特性引入4种交叉、变异算子,增强基因多样性以扩大算法搜索范围;同时设计一种基于关键工厂的邻域搜索算子提升算法的局部搜索能力。最后,以某食品企业实际案例生成测试算例进行仿真实验,实验结果表明与现有多目标优化算法相比,改进NSGA-Ⅱ算法具有优越性,且仿真模型与算法协同具备优化目标多样性的能力,在生产配送集成调度中具有广阔应用前景。展开更多
文摘为保证机床混流装配车间生产的机床准时交付,提出一种基于改进的深度多智能体强化学习的机床混流装配线调度优化方法,以解决最小延迟生产调度优化模型求解质量低、训练速度缓慢问题,构建以最小延迟时间目标的混流装配线调度优化模型,应用去中心化分散执行的双重深度Q网络(double deep Q network,DDQN)的智能体来学习生产信息与调度目标的关系。该框架采用集中训练与分散执行的策略,并使用参数共享技术,能处理多智能体强化学习中的非稳态问题。在此基础上,采用递归神经网络来管理可变长度的状态和行动表示,使智能体具有处理任意规模问题的能力。同时引入全局/局部奖励函数,以解决训练过程中的奖励稀疏问题。通过消融实验,确定了最优的参数组合。数值实验结果表明,与标准测试方案相比,本算法在目标达成度方面,平均总延迟工件数较改善前提升了24.1%~32.3%,训练速度提高了8.3%。
文摘为更好地提升食品企业综合效率,降低企业成本,针对考虑多工厂多客户场景下的生产配送集成调度问题(integrated production and distribution schedule,IPDS),建立最小化makespan和总成本为优化目标的多agent仿真模型,并提出一种改进的NSGA-Ⅱ算法进行求解。针对问题的两阶段集成特性,基于订单分配和加工顺序设计一种二维编码结构,采用仿真模型作为解码器解析各agent行为。在改进NGSA-Ⅱ算法中,采用随机和启发式规则结合的方式产生初始种群,根据问题特性引入4种交叉、变异算子,增强基因多样性以扩大算法搜索范围;同时设计一种基于关键工厂的邻域搜索算子提升算法的局部搜索能力。最后,以某食品企业实际案例生成测试算例进行仿真实验,实验结果表明与现有多目标优化算法相比,改进NSGA-Ⅱ算法具有优越性,且仿真模型与算法协同具备优化目标多样性的能力,在生产配送集成调度中具有广阔应用前景。