时间序列挖掘-预测算法-三次指数平滑法(Holt-Winters)解读.docx

时间序列挖掘-预测算法-三次指数平滑法(Holt-Winters)解读.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要: 所有移动平均法都存在很多问题。它们都太难计算了。每个点的计算都让你绞尽脑汁。而且也不能通过之前的计算结果推算出加权移动平均值。移动平均值永远不可能应用于现有的数据集边缘的数据,因为它们的窗口宽度是有限 ...所有移动平均法都存在很多问题。它们都太难计算了。每个点的计算都让你绞尽脑汁。而且也不能通过之前的计算结果推算出加权移动平均值。移动平均值永远不可能应用于现有的数据集边缘的数据,因为它们的窗口宽度是有限的。这是一个大问题,因为数据集边缘的变动形态一般都是我们最感兴趣的部分。类似地,移动平均法也不能应用于现有数据集的范围之外。其结果是,它们对预测毫无用处。幸运的是,有一种很简单的计算方案能够避免所有这些问题。它叫指数平滑法(exponential smoothing)或Holt-Winters法。指数平滑法有几种不同形式:一次指数平滑法针对没有趋势和季节性的序列,二次指数平滑法针对有趋势但 没有季节性的序列。术语“Holt-Winters法”有时特指三次指数平滑法。所有的指数平滑法都要更新上一时间步长的计算结果,并使用当前时间步长的数据中包含的新信息。它们通过“混合”新信息和旧信息来实现,而相关的新旧信息的权重由一个可调整的拌和参数来控制。各种方法的不同之处在于它们跟踪的量的个数和对应的拌和参数的个数。一次指数平滑法的递推关系特别简单:?其中, 是时间步长i上经过平滑后的值, 是这个时间步长上的实际(未平滑的)数据。你可以看到 是怎么由原始数据和上一时间步长的平滑值 混合而成的。拌和参数 可以是0和1之间的任意值,它控制着新旧信息之间的平衡:当 接近1时,我们就只保留当前数据点(即完全没有对序列进行平滑);当 接近0时,我们就只保留前面的平滑值(也就是说整个曲线都是平的)。为何这个方法被称为“指数”平滑法?要找出答案,展开它的递推关系式即可知道:? 从这里可以看出,在指数平滑法中,所有先前的观测值都对当前平滑值产生了影响,但它们所起的作用随着参数 的幂的增大而逐渐减小。那些相对较早的观测值所起的作用相对较小,这也就是指数变动形态所表现出来的特性。从某种程度上来说,指数平滑法就像是拥有无限记 忆且权值呈指数级递减的移动平均法。(同时也要注意到所有权值的和,等于1,因为当q1 时,几何序列?。参见附录B的几何序列方面的信息。)一次指数平滑所得的计算结果可以在数据集范围之外进行扩展,因此也就可以用来进行预测。预测也非常简单:?其中, 是最后一个已经算出来的值。也就是说,一次指数平滑法得出的预测在任何时候都是一条直线。刚刚描述的一次指数平滑法适用于没有总体趋势的时间序列。如果用来处理有总体趋势的序列,平滑值将往往滞后于原始数据,除非 的值接近1,但这样一来就会造成不够平滑。二次指数平滑法保留了趋势的详细信息,从而改正了这个缺点。换句话说,我们保留并更新两个量的状态:平滑后的信号和平滑后的趋势。它有两个等式和两个拌合参数:?我们先看看第二个等式。这个等式描述了平滑后的趋势。当前趋势的未平滑“值”是当前平滑值和上一个平滑值的差;也就是说,当前趋势告诉我们在上一个 时间步长里平滑信号改变了多少。要想使趋势平滑,我们用一次指数平滑法对趋势进行处理,并使用拌合参数 。为获得平滑信号,我们像上次那样进行一次混合,但要同时考虑到上一个平滑信号及趋势。第一个等式的最后那个项可以对当前平滑信号进行估计——假设在单个 时间步长里我们保持着上一个趋势。若要利用该计算结果进行预测,我们就取最后那个平滑值,然后每增加一个时间步长,就在该平滑值上增加一次最后那个平滑趋势:?最后,我们给三次指数平滑法添加第三个量,用来描述季节性。我们有必要区分一下累加式和累乘式季节性,累加式对应的等式:?累乘式的等式:?其中,pi 是指“周期性”部分, 是这个周期的长度。前面的等式中也包含预测的等式。所有的指数平滑方法都是基于递推关系的,这表明我们要先设定初始值才能使用它们。选择什么样的初始值并不特别重要:指数式衰减规律说明所有的指数平滑方法的“记忆”能力都是很短的,只需经过几个时间步长,初始值的影响就会变得微乎其微。一些合理的初始值:?且?对三次指数平滑法而言,我们必须初始化一个完整的“季节”的值,不过我们可以简单地设置为全1(针对累乘式)或全0(针对累加式)。只有当序列的长度较短时,我们才需要慎重考虑初始值的选取。最后一个问题是如何选择拌合参数。 我的建议是反复试验。先试试0.2和0.4之间的几个值(非常粗略地),然后看看会得到什么结果。或者也可以为(实际数据和平滑算法的结果之间的)误差定 义一个标准,再使用一个数值优化过程来将误差最小化。就我的经验而言,一般没有必要弄得这么麻烦,原因至少有两个:数值优化是一个不能保证收敛的迭代过 程,最终你可能还需要花非常多时间将算

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档