摘要
供应链环境下的库存优化是降低整体成本的重要手段,介绍了供应商管理库存(VMI)的基本概念,研究了由供应商和分销商构成的VMI模型下的库存决策模型,并论述了动态规划方法在该问题上的不足之处以及强化学习方法在该问题上的优势,同时介绍了马尔科夫决策模型(Markov)和半马尔科夫决策模型(semi-Markov)的概念,最后通过一个算例对强化学习方法的过程进行了具体的说明。
Inventory control is an important method for decreasing the cost of supplier chain. An Inventory optimization problem based on VMI is put forward, and why classical DP (Dynamic Programming)algorithm is not applicable, then a semi-Markov Model is constructed and a reinforcement learning algorithm is applied, at last an example is used to explain the procedure of the algorithm.
出处
《科学技术与工程》
2006年第15期2316-2320,2326,共6页
Science Technology and Engineering
基金
国家863计划重点项目(2003AA4Z3370)资助