- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本文使用的运行环境为matlab2014b 各个参数设置为Q值初始化为0 0.4
本文使用的运行环境为matlab2014b 各个参数设置为Q值初始化为0 0.4 0.2 0.4 0.9 0.1 0.11 0
关键词: 动态资源调度,马尔可夫决策过程, Q-learning学习算法
1、引言
随着互联网的发展,各类电商平台也迅速发展,作为实体经济制造业,网上采购也越来越普遍。目前网上采购平台环境下制造资源动态调度问题[1]研究的核心内 容,网上采购平台的动态资源优化调度是基于平台对制造资源和制造任务之间的实时匹配调度,形成最优调度方案。
2、网上采购平台制造资源调度的动态分析
2.1 网上采购平台的动态分析
从网上采购平台的角度,整个网上采购平台的组成结构复杂,参与者众多,其内部一直处于复杂的动态变化中;从制造资源自身的角度,制造资源以数据形式存储于 网上采购平台,其状态属性随着其服务进程实时发生变化。
2.2 制造资源动态调度策略
(1)判断是否进行在调度
①制造进度延迟时间
本文采用制造进度延迟时间α来衡量扰动因素出现后,采购过程中的制造任务在采购周期上发生的变动。
②制造进度延迟率
本文引入制造进度延迟率来表征整个生产项目受扰动的影响,设定制造进度延迟率为:
式(2.1)中,θ表示制造进度延迟率,α为制造进度延迟时间,δ为时间阙值,θ 0表示为最大允许延迟时间空间。当θ超过θ0时进行再调度,否则执行原方案。
(2)何时进行在调度
①制造资源突发故障
在t1时刻,正在进行制造的制造任务Ti的制造资源突发故障。则在t1时刻制造任务集G={T1,T2 … Ti … Tn}中还未开始的制造任务构成新的制造任务集 G1=Ti1unfinished并且每个制造任务的候选资源集由初始的Mi更新为Mi*,平台根据属性变化后的资源集对制造任务集G1生成新的调度方案。
②新制造资源加入
在t2时刻,平台中的还未服务的制造任务接入新的候选资源,则t2时刻在制造任务集G中还未进行服务的任务构成新的制造任务集G2=Ti2unfinished,接入新候选资源 的制造任务的候选资源集由Mi更新为Mi**,对新的制造任务集G2进行重新调度。
③制造资源撤销
在t3时刻,网上采购平台中的一些候选资源因为某些原因撤出平台,若是原调度方案中的制造资源撤销,将会造成对调度方案的影响。则t3时刻在制造任务集G中还 未进行加工的任务构成新的制造任务集G3=Ti3unfinished,发生候选制造资源撤销的制造任务的候选资源集由Mi更新为Mi***,对还未进行服务的任务集G3进行资源调度。
3、制造资源动态调度的马尔可夫决策过程模型
马尔科夫决策过程可以根据每个时刻观察到的状态,从可用的行动集合中选用一个行动做出决策,同时决策者可以根据新观察到的状态再作新的决策,依此反复地进 行。
3.1 状态空间
按照制造任务的先后顺序对制造任务进行编号,状态信息可表示为: S={S1,S2…Si…Sn}其中, Si=(I,k,δ ik), 1≤i≤n,k为制造任务的候选制造资源, δik表示工件在制造任务i的可选制造资源k的状态的信息,δik={0,1,2}, 0表示不在制造资源k处加工, 1表示在制造资源k处加工, 2表示在制造资源k处加工完成。
3.2 行动空间
决策者在制造任务开工后观察加工过程直到当前制造任务完工,此时决策者需选取下一个制造任务的制造资源提供商,比如制造任务2在制造任务1完工后开工,制造
任务1在制造资源提供商2处被服务,制造任务1加工完成后选择制造任务2的制造资源提供商,制造任务2可以选择的制造资源提供商为1,2,3,4,5。这说明状态 (1,2,2)的可用行动集为(2,1,δ i)(2,2,δ i)(2,3,δ i)(2,4,δ i)(2,5,δ i)。
3.3 转移规律
考虑到设备故障等随机因素的影响,采用随机转移矩阵来描述其转移机制: p(k|I,α)表示在工件处于状态i决策者采取行动α时,工件下一时刻转移到状态k的 条件概率。
3.4 奖励函数
奖励函数的计算中包含制造资源服务属性值和物流服务属性。如公式(3.1)所示:
其中Wt表示归一化采购时间权重, Wc表示归一化采购成本权重, Wq表示归一化采购服务质量权重,同时, Wt+Wc+Wq=1。Vt′(tik+tijk′)表示归一化处理后的采购 时间的值,采购成本包括加工成本和物流运输成本; Vc ′(cik+cijk′)表示归一化处理后的采购成本的值,采购成本包括加工成本和物流运输成本; Vq ′(qik)表示归 一化处理后的采购服务质量的值。
3.5 Q-Learning算法
Q学习只根据值函数进行
您可能关注的文档
- 韩国浦项制铁近年发展情况分析.doc
- 后疫情时代的全球秩序.doc
- 后疫情时代国际科技合作转型及政策建议.doc
- 互联网文化内容规制:基本框架、现实困境与优化路径.doc
- 基于AI算法的5G多接入协同方案及关键技术.doc
- 基于创新集群演化理论的高水平专业群教学创新团队建设.doc
- 基于旅游数字足迹的张家界旅游流网络结构研究.doc
- 基于区块链的真实世界数据共享系统研究.doc
- 基于脱钩视角城市土地利用效率变化研究——以云南省为例.doc
- 基于网络正负两级评价的旅游形象感知研究——以清明上河园为例.doc
- 2024-2030年花香蜡烛行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
- 2024-2030年自动障碍物和系船柱行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
- 2024-2030年自动眼镜磨边机行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
- 2024-2030年自洁水瓶行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
- 2024-2030年花油行业市场现状供需分析及投资评估规划分析研究报告.docx
- 2024-2030年航空探伤仪行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
- 2024-2030年薄型电视机行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
- 2024-2030年蔬菜种子行业市场前景分析及发展趋势与投资风险研究报告.docx
- 2024-2030年蓝牙适配器行业市场深度调研及发展前景与投资研究报告.docx
- 2024-2030年维生素B1(食品应用)行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
最近下载
- 《机器人机械工程基础I》课程教学大纲(本科).pdf
- 2024苏教版数学新教材培训:“统计与概率”领域编修说明.docx VIP
- 净化系统的设计讲义.ppt
- 麦格米特artsen pm cm系列智能焊机用户手册sm megmeet1.pdf
- 压力容器质量安全风险管控清单〔压力容器制造(含安装、修理、改造)单位〕.pdf VIP
- 2023年华为公司招聘职位要求.pdf
- GB-粉尘爆炸泄压规范.pdf
- 茶园节水灌溉技术方案.pptx
- 医院分期建设实施要点分享---以浙江大学医学院附属儿童医院滨江院区为例(分享版).pdf VIP
- 2024年华医网继续教育临床静脉用药质量管理与风险防范答案.docx VIP
文档评论(0)