基于强化学习算法的供应链自适应随机库存控制研究.pdfVIP

下载本文档

13
0
约1.13万字
约 5页
2015-08-20 发布于未知
举报

基于强化学习算法的供应链自适应随机库存控制研究.pdf

一般工业技术

第 27卷第 4期青岛大学学报 (工程技术版 ) Vol_27No．4 2012年 12月 JOURNALOFQINGDAOUNIVERSITY (E＆T) Dec．20 12 文章编号：1006—9798(2012)04一O011—05 基于强化学习算法的供应链自适应随机库存控制研究宋晓鹏，张纪会，张超群，马清悦 (青岛大学复杂性科学研究所，山东青岛 266071) 摘要：针对非平稳随机需求的多级多周期供应链库存控制，本文建立了一种包括一个供应商和多个零售商的供应链分散式自适应库存控制模型，以满足给定的零售商服务水平。同时，运用强化学习算法，并根据需求变化情况，供应商和零售商分别自适应地调整库存控制参量。仿真试验表明，当相对需求分布已知，而需求未知时，订货量和服务水平都相对不稳定；安全因子范围大的，订货量和服务水平的波动相对较大，且能够更快的把服务水平调整到目标服务水平区问内。该模型是合理和有效的。关键词：自适应库存控制；强化学习；仿真；供应链中图分类号：TP273 ．2；F253．4 文献标识码：A 库存的主要作用在于缓冲供给和需求之间的矛盾。库存管理通过制定政策和流程以及开展活动等方式来确保每一个存货单项和商业组织在任何时候都拥有适当的数量。库存控制是以对存储商品、订货时间和数量 3个基本问题的回答为基础。近年来，随着用户需求的不确定性和多样性的增加，库存控制引起人们极大的关注。为此，自适应库存控制策略应运而生。H．Scarf等人_1-4把库存控制看成一个动态规划问题，并且运用历史的需求数据自适应地估计需求分布的不确定参数；对于一对一的库存控制问题，A．Packerl5提出了(Q，R)库存策略，充分利用需求历史来减少库存的相关费用；K．Moinzadeh_l6]提出了供应商补货策略，当零售商库存量达到R十S时，供应商向上游发布订单，那些服从泊松分布的顾客需求可以得到相应的 S 值。对于分散型供应链，ZhaoXiande等人_7建立了零售商订单奖惩策略，该策略可使供应商能够更好地利用资源并顺利生产，从而减少整个供应链的成本；P．Pontrandolfo_8将强化学习算法应用于跨国公司的供应链协调和集成问题。由于产品生命周期的缩短，假设需求分布已知则显得不合理，对于在需求分布未知时的库存控制问题，C．0．KimE提出了集中式和发散式两个自适应库存控制模型；孙超等人l1。。将强化学习算法运用到 VMI自适应库存控制中。目前，虽然供应链库存控制已经得到大量研究，但是非平稳随机需求的多级多周期供应链库存控制还没有很好的解决，对此，本文建立一种包括一个供应商和多个零售商的供应链分散式自适应控制模型，以满足零售商确定的服务水平，仿真算例验证了该模型的合理性和算法的有效性。 1 模型描述考虑由一个供应商和多个零售商组成的两级供应链口]。假设顾客需求是非平稳的随机过程，即需求分布的平均值和方差随时间变化，而供应商补货的交付周期是固定的。零售商的服务水平是指从发布订单的时刻到库存补给时刻内满足顾客需求的百分比。为了获得更高的服务水平，必须有更多的商品来应对顾客的不确定性需求，这样就增加了库存量，造成了更多的费用，所以零售商不是获得越高的服务水平就越好。模型中，假设目标服务水平是 [a，6]。安全因子不是固定的，如果使用某个安全因子得到比较好的效果，那么在需求波动不大的前提下，所采用的安全因子与这个安全因子差别不大，那么库存控制效果也会较好。本文所设计的模型中，假设从 6个区收稿日期：2012—07—12 基金项目：山东省自然科学基金项目资助 (ZR2olOGMO06) 作者简介：宋晓鹏 (1987一)，男，硕士研究生，主要研究方向为物流与供应链管理。 12 青岛大学学报 (工程技术版 ) 第 27卷间随机产生 6个安全因子。

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于强化学习算法的供应链自适应随机库存控制研究.pdfVIP