第16章-RapidMiner时间序列.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《RapidMiner数据分析与挖掘实战》第16章 PAGE 359 时间序列 时序模式 就餐饮企业而言,经常会碰到这样的问题: 由于餐饮行业是生产和销售同时进行的,因此销售预测对于餐饮企业十分必要。如何基于菜品历史销售数据,做好餐饮销售预测?以便减少菜品脱销现象和避免因备料不足而造成的生产延误,从而减少菜品生产等待时间,提供给客户更优质的服务,同时可以减少安全库存量,做到生产准时制,降低物流成本。 餐饮销售预测可以看作是基于时间序列的短期数据预测,预测对象为具体菜品销售量。 常用按时间顺序排列的一组随机变量 来表示一个随机事件的时间序列,简记为;用或表示该随机序列的个有序观察值,称之为序列长度为的观察值序列。 本章应用时间序列分析的目的就是给定一个已被观测了的时间序列,预测该序列的未来值。 16.1.1时间序列算法 常用的时间序列模型见 REF _Ref413179307 \h 表161。 表16 SEQ 表 \* ARABIC \s 1 1常用时间序列模型 模型名称 描述 平滑法 平滑法常用于趋势分析和预测,利用修匀技术,削弱短期随机波动对序列的影响,使序列平滑化。根据所用平滑技术的不同,可具体分为移动平均法和指数平滑法。 趋势拟合法 趋势拟合法把时间作为自变量,相应的序列观察值作为因变量,建立回归模型。根据序列的特征,可具体分为线性拟合和曲线拟合。 组合模型 时间序列的变化主要受到长期趋势()、季节变动()、周期变动()和不规则变动()这四个因素的影响。根据序列的特点,可以构建加法模型和乘法模型。 加法模型: 乘法模型: AR模型 以前期的序列值为自变量、随机变量的取值为因变量建立线性回归模型。 MA模型 随机变量的取值与以前各期的序列值无关,建立与前期的随机扰动的线性回归模型。 ARMA模型 随机变量的取值不仅与以前期的序列值有关,还与前期的随机扰动有关。 ARIMA模型 许多非平稳序列差分后会显示出平稳序列的性质,称这个非平稳序列为差分平稳序列。对差分平稳序列可以使用ARIMA模型进行拟合。 ARCH模型 ARCH模型能准确地模拟时间序列变量的波动性的变化,适用于序列具有异方差性并且异方差函数短期自相关。 GARCH模型及其衍生模型 GARCH模型称为广义ARCH模型,是ARCH模型的拓展。相比于ARCH模型,GARCH模型及其衍生模型更能反映实际序列中的长期记忆性、信息的非对称性等性质。 本章将重点介绍AR模型、MA模型、ARMA模型和ARIMA模型。 16.1.2 时间序列的预处理 拿到一个观察值序列后,首先要对它的纯随机性和平稳性进行检验,这两个重要的检验称为序列的预处理。根据检验结果可以将序列分为不同的类型,对不同类型的序列会采取不同的分析方法。 对于纯随机序列,又叫白噪声序列,序列的各项之间没有任何相关关系,序列在进行完全无序的随机波动,可以终止对该序列的分析。白噪声序列是没有信息可提取的平稳序列; 对于平稳非白噪声序列,它的均值和方差是常数,现已有一套非常成熟的平稳序列的建模方法。通常是建立一个线性模型来拟合该序列的发展,借此提取该序列的有用信息。ARMA模型是最常用的平稳序列拟合模型; 对于非平稳序列,由于它的均值和方差不稳定,处理方法一般是将其转变为平稳序列,这样就可以应用有关平稳时间序列的分析方法,如建立ARMA模型来进行相应的研究。如果一个时间序列经差分运算后具有平稳性,成该序列为差分平稳序列,可以使用ARIMA模型进行分析。 平稳性检验 平稳时间序列的定义 对于随机变量,可以计算其均值(数学期望)、方差;对于两个随机变量量和,可以计算的协方差和相关系数,它们度量了两个不同事件之间的相互影响程度。 对于时间序列,任意时刻的序列值都是一个随机变量,每一个随机变量都会有均值和方差,记的均值为,方差为;任取,定义序列的自协方差函数和自相关系数(特别地,),之所以称它们为自协方差函数和自相关系数,是因为它们衡量的是同一个事件在两个不同时期(时刻和)之间的相关程度,形象地讲就是度量自己过去的行为对自己现在的影响。 如果时间序列在某一常数附近波动且波动范围有限,即有常数均值和常数方差,并且延迟期的序列变量的自协方差和自相关系数是相等的或者说延迟期的序列变量之间的影响程度是一样的,则称为平稳序列。 平稳性的检验 对序列的平稳性的检验有两种检验方法,一种是根据时序图和自相关图的特征做出判断的图检验,该方法操作简单、应用广泛,缺点是带有主观性;另一种是构造检验统计量进行的方法,目前最常用的方法是单位根检验。 时序图检验 根据平稳时间序列的均值和方差都为常数的性质,平稳序列的时序图显示该序列值始终在一个常数附近随机波动,而且波动的范围有界;如果有明显的趋势性或者周期性那它通常不是平稳序列。 自相关图

文档评论(0)

yyons2019 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档