基于性能预测的遗传强化学习动态调度方法被引量：7

Genetic Reinforcement Learning Approach to Dynamic Scheduling Based on Performance Prediction

导出

摘要针对作业车间动态调度问题,在模式驱动调度的框架下,提出遗传强化学习动态调度方法。首先,采用优先规则编码的染色体表达问题的解,将染色体分割成基因模式作为分阶段调度算法的状态模式;其次,设计性能预测变量,构建启发式立即回报函数,引导和加快遗传强化学习算法的搜索进程;再次,设置遗传算子、强化学习及其相关参数以实现搜索过程"开采"与"探索"之间的平衡;最后,仿真实验结果验证了遗传强化学习调度方法的有效性。 In the framework of pattern driven scheduling,a genetic reinforcement learning （GRL） approach to schedule the job in the dynamical job-shop was proposed.First,the chromosome was coded by preference rules-based representation for the problem.The chromosome was divided into gene schema as state patterns for the multi-phase scheduling system.Secondly,a performance predictive variable to construct instant reward function was designed which was used to guide the learning system to progress rapidly.Thirdly,genetic operators,RL and controlling parameters carried out the search strategy for the balance of ＂exploration＂ and ＂exploitation＂.Finally,the simulation results verify the efficiency of GRL scheduling approach.

作者魏英姿谷侃锋

机构地区沈阳理工大学信息科学与工程学院中国科学院沈阳自动化研究所沈阳现代装备研究设计中心

出处《系统仿真学报》 CAS CSCD 北大核心 2010年第12期2809-2812,2820,共5页 Journal of System Simulation

基金辽宁省自然科学基金项目(20092060)

关键词强化学习遗传算法预测生产周期作业车间动态调度 reinforcement learning genetic algorithm prediction makespan dynamic job-shop scheduling

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献11

1Sun D, Lin L. A dynamic job shop scheduling framework: A backward approach [J]. International Journal of Production Research (S0020-7543), 1994, 32(4): 967-985.
2K M Mohanasundaram, K Natarajan, G Viswanathkumar, P Radhakrishnan, C Rajendran. Scheduling rules for dynamic shops that manufacture multi-level jobs [J]. Computers & Industrial Engineering (S0360-8352), 2003, 44(1): 119-131.
3孙容磊,熊有伦,杜润生,丁汉.规则调度的迭代优化[J].计算机集成制造系统-CIMS,2002,8(7):546-550. 被引量：10
4Sutton R S, A Barto G. Reinforcement Learning: An Introduction [M]. Cambridge, MA, USA: MIT Press, 1998.
5Zhang Wei. Reinforcement Learning for Job-Shop Scheduling [D]. USA: Oregon State University, 1996.
6Aydin M E., Oztemel E. Dynamic Job-Shop Scheduling using Reinforcement Learning Agents [J]. Robotics and Autonomous Systems (S0921-8890), 2000, 33(2): 169-178.
7Wang Y-C, Usher J M. Application of reinforcement learning for agent-based production scheduling [J]. Engineering Applications of Artificial Intelligence (S0952-197), 2005, 18(1): 73-82.
8Pettinger J E, Everson R M. Controlling genetic algorithms with reinforcement learning [C]// Proceedings of the Genetic and Evolutionary Computation Conference. San Francisco, CA, USA: Morgan Kaufmann, 2002: 692-697.
9王本年,高阳,陈兆乾,谢俊元,陈世福.RLGA:一种基于强化学习机制的遗传算法[J].电子学报,2006,34(5):856-860. 被引量：9
10潘燕春,周泓,冯允成,魏佳呈.同顺序Flow-shop问题的一种遗传强化学习算法[J].系统工程理论与实践,2007,27(9):115-122. 被引量：4

二级参考文献28

1吕赐兴,朱云龙,尹朝万,于海斌.基于多Agent的敏捷生产调度中的协商策略[J].计算机集成制造系统,2006,12(4):579-584. 被引量：5
2赵新宇,林作铨.合同网协议中的Agent可信度模型[J].计算机科学,2006,33(6):150-153. 被引量：15
3Nix A E,Vose M D.Modeling genetic algorithms with Markov chains[J].Annals Mathematics and Artificial Intelligence,1992,5(1):77-88.
4Sutton R S,Butro A G.Reinforcement Learning:Introduction[M].Cambridge,MA:MIT Press,1998.
5Holland J H.A mathematical framework for studying learning in classifier systems[J].Physica,1986,22D(1-3):307-317.
6Dorigo M,Bersini H.A comparison of Q-learning and classifier systems[A].Proceedings of From Animals to Animats,Third International Conference on SIMULATION of Adaptive Behavior[C].MA:MIT Press,1994.248-255.
7Qi D,Sun R.A multi-agent system integrating reinforcement learning,bidding and genetic algorithms[J].Web Intelligence and Agent Systems,2003,1(3-4):187-202.
8Eriksson A,Capi G,Doya K.Evolution of metaparamters in reinforcement learning algorithm[A].Proceedings of IEEE/RSJ International Conference on Intelligent Robots and Systems[C].Piscataway NJ:IEEE Press,2003.412-417.
9Pettinger J E,Everson R M.Controlling genetic algorithms with reinforcement learning[A].Proceedings of the Genetic and Evolutionary Computation Conference[C].San Francisco,CA:Morgan Kaufmann,2002.692-692.
10Watkins C J C H,Dayan P.Technical note:Q-learning[J].Machine Learning,1992,8(3-4):279-292.

共引文献23

1胡雅丽,杨建军.基于约束规则的作业车间调度研究[J].航空精密制造技术,2012,48(5):43-46. 被引量：5
2董红召,刘冬旭,赵燕伟,陈鹰.分形网络协同制造中进度监控的方法及实现[J].计算机集成制造系统,2004,10(7):779-783. 被引量：5
3刘琳,谷寒雨,席裕庚.一种基于分解交货期的Job Shop启发式调度算法[J].控制与决策,2006,21(3):253-257. 被引量：2
4王国新,宁汝新,王爱民,唐承统,武志军.基于仿真的调度规则组合决策研究[J].北京理工大学学报,2006,26(7):598-601. 被引量：11
5王伟达,王伟,刘文剑.基于仿真的生产计划与调度系统集成[J].计算机工程与设计,2007,28(7):1626-1629. 被引量：5
6魏英姿,曲艳丽,胡玉兰.基于合同网协议交互投标的动态调度方法研究[J].计算机科学,2007,34(7):124-127. 被引量：4
7王国新,宁汝新,王爱民.基于仿真的生产调度优化技术研究[J].计算机集成制造系统,2007,13(7):1419-1427. 被引量：32
8王国新,宁汝新,王爱民.基于仿真和正交试验的优化调度研究[J].中国机械工程,2007,18(20):2444-2448. 被引量：3
9王伟达,刘文剑.一种基于混合决策树的调度知识获取算法[J].计算机应用研究,2007,24(12):54-56. 被引量：2
10姚金涛,杨波.一种具有自然血亲排斥的遗传算法研究[J].计算机工程与应用,2008,44(16):27-29. 被引量：3

同被引文献61

1谢庆刚,吴疆,朱建龙.炼钢区域智能废钢车间无人化配料系统设计[J].冶金自动化,2022,46(S01):427-432. 被引量：4
2盛立纲,顾幸生.混合遗传NEH算法在流水车间调度中的应用[J].控制工程,2010,17(4):497-500. 被引量：5
3郑锋,孙树栋,吴秀丽.基于遗传算法和模型仿真的调度规则决策方法[J].计算机集成制造系统,2004,10(7):808-814. 被引量：7
4魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
5金锋,吴澄.大规模生产调度问题的研究现状与展望[J].计算机集成制造系统,2006,12(2):161-168. 被引量：35
6王国新,宁汝新,王爱民,唐承统,武志军.基于仿真的调度规则组合决策研究[J].北京理工大学学报,2006,26(7):598-601. 被引量：11
7李琳,江志斌.虚拟生产系统的自适应动态调度机理及算法[J].计算机集成制造系统,2006,12(9):1444-1452. 被引量：8
8王世进,周炳海,奚立峰.基于过滤定向搜索的柔性制造系统动态调度优化[J].上海交通大学学报,2007,41(1):94-99. 被引量：5
9肖志娇,常会友,衣杨.启发式规则与GA结合的优化方法求解工作流动态调度优化问题[J].计算机科学,2007,34(2):157-160. 被引量：10
10潘燕春,冯允成,周泓,魏佳呈.强化学习和仿真相结合的车间作业排序系统[J].控制与决策,2007,22(6):675-679. 被引量：3

引证文献7

1刘想德.基于自适应规则的车间实时调度方法研究[J].组合机床与自动化加工技术,2014(2):157-160. 被引量：4
2鲁建厦,景峰.基于改进定向搜索算法的作业车间瓶颈控制研究[J].浙江工业大学学报,2014,42(3):269-273. 被引量：2
3王玉芳,严洪森.基于改进Q学习的知识化制造自适应动态调度策略[J].控制与决策,2015,30(11):1930-1936. 被引量：4
4单鑫,王艳,纪志成.基于参数知识鸽群算法的离散车间能效优化[J].系统仿真学报,2017,29(9):2140-2148. 被引量：7
5徐翔斌,李志鹏.强化学习在运筹学的应用:研究进展与展望[J].运筹与管理,2020,29(5):227-239. 被引量：16
6李新宇,黄江平,李嘉航,李育鑫,高亮.智能车间动态调度的研究与发展趋势分析[J].中国科学：技术科学,2023,53(7):1016-1030. 被引量：21
7刘胜,于海强.基于改进遗传算法的多目标FJSP问题研究[J].控制工程,2016,23(6):816-822. 被引量：32

二级引证文献86

1王维祺,叶春明,谭晓军.基于Q学习算法的作业车间动态调度[J].计算机系统应用,2020,29(11):218-226. 被引量：9
2赵永叶,贲树军.学习马尔可夫模型的低秩谱估计算法[J].数学进展,2023,52(4):741-755.
3罗雄,钱谦,伏云发.无非法解遗传算法求解柔性作业车间调度问题[J].电子测量技术,2020,43(7):36-40. 被引量：4
4金寿松,魏银梅,金思妍.基于改进遗传算法的分批调度研究[J].成组技术与生产现代化,2015,32(2):43-47. 被引量：3
5张裕祥,王桂棠,梁文杰.发动机缸套制造系统实时调度方法研究[J].内燃机与配件,2016(6):12-15.
6轩华,秦莹莹,王薛苑,张百林.带恶化工件的PFS调度的混合遗传算法[J].工业工程与管理,2017,22(3):1-6. 被引量：10
7王雷,蔡劲草,石鑫.基于改进遗传算法的多目标柔性作业车间节能调度问题[J].南京理工大学学报,2017,41(4):494-502. 被引量：24
8何斌,张接信,张富强.柔性作业车间调度问题简明分析[J].装备制造技术,2018(5):68-71. 被引量：1
9包博,李体方.考虑设备随机故障的装备维修作业调度方法[J].计算机工程与应用,2017,53(9):258-262. 被引量：5
10李浩,毕利,靳彬锋.改进的粒子群算法在多目标车间调度的应用[J].计算机应用与软件,2018,35(3):49-53. 被引量：10

1廖强,周凯,张伯鹏.基于现场总线的多Agent作业车间动态调度问题的研究[J].中国机械工程,2000,11(7):757-759. 被引量：13
2王小哲.作业车间动态调度建模与仿真研究[J].电脑编程技巧与维护,2011(22):114-115.
3杨潇,李峰,向凌云.基于矩阵编码的同义词替换隐写算法[J].小型微型计算机系统,2015,36(6):1296-1300. 被引量：11
4郭牧,孙占全,潘景山,徐梅.短时交通流预测方法研究[J].计算机应用研究,2008,25(9):2676-2678. 被引量：13
5杨臻明,岳继光,王晓保,萧蕴诗.基于独立成分分析的含噪声时间序列预测[J].控制与决策,2013,28(4):501-505. 被引量：3
6朱传军,邱文,张超勇,金亮亮.多目标柔性作业车间稳健性动态调度研究[J].中国机械工程,2017,28(2):173-182. 被引量：26
7孙晟,王世进,奚立峰.基于强化学习的模式驱动调度系统研究[J].计算机集成制造系统,2007,13(9):1795-1800. 被引量：3
8潘燕春,周泓.Job-shop排序问题的遗传强化学习算法[J].计算机工程,2009,35(16):25-28. 被引量：2
9敬雪,滕奇志,唐棠,王姝.有效的染色体分割新方法[J].计算机工程与应用,2008,44(35):182-184. 被引量：1
10吴斌,郭贤生.基于粗集规则编码的神经网络控制器设计[J].电子科技大学学报,2006,35(5):798-800.

系统仿真学报

2010年第12期

浏览历史

内容加载中请稍等...

基于性能预测的遗传强化学习动态调度方法被引量：7

参考文献11

二级参考文献28

共引文献23

同被引文献61

引证文献7

二级引证文献86

相关作者

相关机构

相关主题

浏览历史

基于性能预测的遗传强化学习动态调度方法 被引量：7

参考文献11

二级参考文献28

共引文献23

同被引文献61

引证文献7

二级引证文献86

相关作者

相关机构

相关主题

浏览历史

基于性能预测的遗传强化学习动态调度方法被引量：7