- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本文使用的运行环境为matlab2014b 各个参数设置为Q值初始化为0 0.4
本文使用的运行环境为matlab2014b 各个参数设置为Q值初始化为0 0.4 0.2 0.4 0.9 0.1 0.11 0
关键词: 动态资源调度,马尔可夫决策过程, Q-learning学习算法
1、引言
随着互联网的发展,各类电商平台也迅速发展,作为实体经济制造业,网上采购也越来越普遍。目前网上采购平台环境下制造资源动态调度问题[1]研究的核心内 容,网上采购平台的动态资源优化调度是基于平台对制造资源和制造任务之间的实时匹配调度,形成最优调度方案。
2、网上采购平台制造资源调度的动态分析
2.1 网上采购平台的动态分析
从网上采购平台的角度,整个网上采购平台的组成结构复杂,参与者众多,其内部一直处于复杂的动态变化中;从制造资源自身的角度,制造资源以数据形式存储于 网上采购平台,其状态属性随着其服务进程实时发生变化。
2.2 制造资源动态调度策略
(1)判断是否进行在调度
①制造进度延迟时间
本文采用制造进度延迟时间α来衡量扰动因素出现后,采购过程中的制造任务在采购周期上发生的变动。
②制造进度延迟率
本文引入制造进度延迟率来表征整个生产项目受扰动的影响,设定制造进度延迟率为:
式(2.1)中,θ表示制造进度延迟率,α为制造进度延迟时间,δ为时间阙值,θ 0表示为最大允许延迟时间空间。当θ超过θ0时进行再调度,否则执行原方案。
(2)何时进行在调度
①制造资源突发故障
在t1时刻,正在进行制造的制造任务Ti的制造资源突发故障。则在t1时刻制造任务集G={T1,T2 … Ti … Tn}中还未开始的制造任务构成新的制造任务集 G1=Ti1unfinished并且每个制造任务的候选资源集由初始的Mi更新为Mi*,平台根据属性变化后的资源集对制造任务集G1生成新的调度方案。
②新制造资源加入
在t2时刻,平台中的还未服务的制造任务接入新的候选资源,则t2时刻在制造任务集G中还未进行服务的任务构成新的制造任务集G2=Ti2unfinished,接入新候选资源 的制造任务的候选资源集由Mi更新为Mi**,对新的制造任务集G2进行重新调度。
③制造资源撤销
在t3时刻,网上采购平台中的一些候选资源因为某些原因撤出平台,若是原调度方案中的制造资源撤销,将会造成对调度方案的影响。则t3时刻在制造任务集G中还 未进行加工的任务构成新的制造任务集G3=Ti3unfinished,发生候选制造资源撤销的制造任务的候选资源集由Mi更新为Mi***,对还未进行服务的任务集G3进行资源调度。
3、制造资源动态调度的马尔可夫决策过程模型
马尔科夫决策过程可以根据每个时刻观察到的状态,从可用的行动集合中选用一个行动做出决策,同时决策者可以根据新观察到的状态再作新的决策,依此反复地进 行。
3.1 状态空间
按照制造任务的先后顺序对制造任务进行编号,状态信息可表示为: S={S1,S2…Si…Sn}其中, Si=(I,k,δ ik), 1≤i≤n,k为制造任务的候选制造资源, δik表示工件在制造任务i的可选制造资源k的状态的信息,δik={0,1,2}, 0表示不在制造资源k处加工, 1表示在制造资源k处加工, 2表示在制造资源k处加工完成。
3.2 行动空间
决策者在制造任务开工后观察加工过程直到当前制造任务完工,此时决策者需选取下一个制造任务的制造资源提供商,比如制造任务2在制造任务1完工后开工,制造
任务1在制造资源提供商2处被服务,制造任务1加工完成后选择制造任务2的制造资源提供商,制造任务2可以选择的制造资源提供商为1,2,3,4,5。这说明状态 (1,2,2)的可用行动集为(2,1,δ i)(2,2,δ i)(2,3,δ i)(2,4,δ i)(2,5,δ i)。
3.3 转移规律
考虑到设备故障等随机因素的影响,采用随机转移矩阵来描述其转移机制: p(k|I,α)表示在工件处于状态i决策者采取行动α时,工件下一时刻转移到状态k的 条件概率。
3.4 奖励函数
奖励函数的计算中包含制造资源服务属性值和物流服务属性。如公式(3.1)所示:
其中Wt表示归一化采购时间权重, Wc表示归一化采购成本权重, Wq表示归一化采购服务质量权重,同时, Wt+Wc+Wq=1。Vt′(tik+tijk′)表示归一化处理后的采购 时间的值,采购成本包括加工成本和物流运输成本; Vc ′(cik+cijk′)表示归一化处理后的采购成本的值,采购成本包括加工成本和物流运输成本; Vq ′(qik)表示归 一化处理后的采购服务质量的值。
3.5 Q-Learning算法
Q学习只根据值函数进行
您可能关注的文档
- 韩国浦项制铁近年发展情况分析.doc
- 后疫情时代的全球秩序.doc
- 后疫情时代国际科技合作转型及政策建议.doc
- 互联网文化内容规制:基本框架、现实困境与优化路径.doc
- 基于AI算法的5G多接入协同方案及关键技术.doc
- 基于创新集群演化理论的高水平专业群教学创新团队建设.doc
- 基于旅游数字足迹的张家界旅游流网络结构研究.doc
- 基于区块链的真实世界数据共享系统研究.doc
- 基于脱钩视角城市土地利用效率变化研究——以云南省为例.doc
- 基于网络正负两级评价的旅游形象感知研究——以清明上河园为例.doc
- 2025年广西中考地理二轮复习:专题四+人地协调观+课件.pptx
- 2025年广西中考地理二轮复习:专题三+综合思维+课件.pptx
- 2025年中考地理一轮教材梳理:第4讲+天气与气候.pptx
- 第5讲+世界的居民课件+2025年中考地理一轮教材梳理(商务星球版).pptx
- 冀教版一年级上册数学精品教学课件 第1单元 熟悉的数与加减法 1.1.6 认识1-9 第6课时 合与分.ppt
- 2025年中考一轮道德与法治复习课件:坚持宪法至上.pptx
- 2025年河北省中考一轮道德与法治复习课件:崇尚法治精神.pptx
- 八年级下册第二单元+理解权利义务+课件-2025年吉林省中考道德与法治一轮复习.pptx
- 精品解析:湖南省娄底市2019-2020学年八年级(上)期中考试物理试题(原卷版).doc
- 2025年中考地理一轮教材梳理:第10讲+中国的疆域与人口.pptx
最近下载
- 2025内蒙古能源集团智慧运维公司社会招聘笔试备考题库及答案解析.docx
- 标准图集-07FG01-人防工程图集-防空地下室设计荷载及结构构造.pdf
- 2025内蒙古能源集团智慧运维公司社会招聘(105人)笔试备考题库及答案解析.docx
- 黑龙江省哈尔滨市第三中学2023-2024学年高三上学期1月期末考试+化学+Word版含解析.docx
- 中草药栽培技术 课件 项目1--3 中草药的有性繁殖、中草药的无性繁殖、根及根茎类药材的栽培.pptx
- 高中英语北师大版选择性必修第四册Unit10Lesson2Communityspirit课件.pptx
- 高中政治人教版新教材必修一《中国特色社会主义》必备的知识点材料.pdf VIP
- 数学探究 用向量法研究三角形的性质.pptx
- T∕CACM 011-2016 中医药单用联合抗生素治疗常见感染性疾病临床实践指南 单纯性下尿路感染.docx VIP
- 2025年鞍钢集团有限公司人员招聘笔试备考题库.docx
文档评论(0)