- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SAS Forcast Studio多产品销量数据分类方法探析
基于SAS Forcast Studio多产品销量数据分类方法探析
摘 要:时间序列预测方法仍是数据挖掘的主要方法之一,在应用方面,软件SAS Forcast Studio(简称FS)能够同时对多个产品、快速进行预测,建立快速、批量、自动的时间序列预测模型群;极大地提高了数据挖掘的处理效率和预测准确率。然而单纯的原始时间序列直接投入FS里的效果不及对数据先处理后理想,需要对时间序列先进行数据处理,其中分类处理是其中一个必要的环节。因此,本文基于SAS 的时间序列模块软件FS来探析多产品销量数据分类方法,从而提高FS预测模型的准确率。
关键词:多产品;SAS Forcast Studio;时间序列;数据分类方法
随着社会的发展和计算机技术的进步,数据挖掘技术的应用越来越广泛,已在经济、气象、地质、历史文化、军事、新闻、医药、农业等领域产生了显著的经济效益和社会效益。主要是从海量数据中挖掘潜在的知识、信息,包括聚类分析、分类预测(如决策树、神经网络、LOGISTIC等)、生存分析、时间序列预测、回归分析等。时间序列预测方法仍然是数据挖掘的主要方法之一,其主要思想是:找出历史数据揭示现象随时间变化的规律,将这种规律延伸到未来,从而对该现象的未来作出预测。为了提高预测计划质量,应对公司业务的规模发展,除了借助依据业务流程形成的各类预测方法,还需要主观干预较少的科学预测方法--让数据说话的科学统计预测方法,借助SAS数据分析软件,实现科学的预测,为公司业务整体预测计划和资源效率的提升提供坚实的基础。因此,本文基于SAS的时间序列模块软件FS来探析多产品销量数据分类方法,以此提高FS预测模型的准确率。
一、FS在时间序列分析方法中的应用概述
SAS FS能够同时对多个产品、快速进行预测,建立快速、批量、自动的销量预测模型群;挖掘人员可结合各种业务场景设计多种策略实现精细化建模;开发各种接口支撑模型的可调节、可拓展性;并采用后评估方式为建模人员模型优化提供支撑,通过BI平台实现资源共享。FS能够利用事件、日历、广告促销和因果变量等各类销量影响因素并融合这些因素进行建模预测,而且能自动识别数据模式,生成预测结果,实现预测模型自动化。通过FS输出的预测结果,公司和企业相关人员可根据销售目标和其他约束条件进行调整,从而制订合理的采购策略。
二、时间序列数据分类方法
由于多产品间存在相关关系,有转化性、竞争性。部分产品因某些特殊因素导致销量波动较大,但结合相关产品整体数据来看比较稳定。因此对于多产品销量数据先进行分类是必要的。最常见大体有以下几种分类方式,以某奶粉公司产品为例:(1)从转化性来看,按产品系列打包调节预测,如金装1-4打包,超金1-4打包等;(2)按产品品牌内替代性打包调节预测,如金装1、超金1、超呵1、呵护1打包等;(3)按产品品牌间替代性打包调节预测,如素加与好婴儿奶粉打包等。
1.按波动性分类
由于各产品销量方差(或极差)可用来衡量其波动范围的大小,因此,可通过构建该统计量来对产品销量波动性进行描述,然后再利用k倍δ的原理对数据分类,k值可以根据用户需求自己定义。其思路可以归纳如下:
(1)针对单个产品,利用最近一年的产品实际销量值求解其方差δ2;
(2)针对所有产品,利用所得的方差δi2求解[-kδ0,+kδ0];
(3)根据(2)求得的区间将原始数据分为三类,将大于区间上限值的归为一类,将小于区间下限值的归为一类,将大于区间下限值小于区间上限值的归为一类。
2.按销量大小分类
四分位数方法:四分位数是统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。该样本中所有数值由小到大排列后第25%的数字为Q1,该样本中所有数值由小到大排列后第50%的数字为Q2,该样本中所有数值由小到大排列后第75%的数字为Q3。利用四位数方法将原始数据分成四类,分别为:75%。
对于产品销量数据,各产品销量中位数可用来衡量其销量大概所处的位置,因此,通过构建该统计量来对产品销量大小进行分类。
3.按历史数据长度
根据提供的销量数据的长度,以历史数据为2013.03~2015.06为例,按历史数据长度分别为小于1年,1年~2年,2年以上,将产品分为3类。
4.综合分类方法
在FS建模时,有多种调节层级的方法,不同的层级调节可以生成不同的预测模型,为了得到最优预测模型,因此需要综合考虑波动分类、销量大小、序列长度等组合的影响因素。
三、实验过程
根据中国某信息与通信解决方案以及智能终端生产企业的各产品每天的销量数据来进行时间序列预测分析,共1220个产品item,产品种类多,数据量大。将数据集分成拟合数据集、
您可能关注的文档
最近下载
- 17J008 挡土墙(重力式、衡重式、悬臂式)(最新).pdf VIP
- 雨污分流改造工程施工组织设计方案.pdf VIP
- 第九版儿科学配套课件-6.2-正常足月儿和早产儿的特点与护理.ppt VIP
- T_CACM 1601-2024 笑病中医诊疗指南.docx VIP
- 矿山三级(二级)矿量管理办法.doc VIP
- T_CACM 1583-2024 百合病中医诊疗指南.pdf VIP
- 趣味生物知识竞赛100选择题附答案.pdf VIP
- T_CACM 1584-2024 卑惵中医诊疗指南.pdf VIP
- 2025年第二批陕西延长石油集团所属单位内部遴选及选聘81人笔试参考题库附带答案详解.docx
- T_CACM 1585-2024 产后神志异常中医诊疗指南.pdf VIP
文档评论(0)