用R语言做时间序列分析精选.doc

用R语言做时间序列分析精选

用R语言做时间序列分析 时间序列(time series)是一系列有序的数据。通常是等时间间隔的采样数据。如果不是等间隔,则一般会标注每个数据点的时间刻度。 ?下面以time series 普遍使用的数据 airline passenger为例。 这是十一年的每月乘客数量,单位是千人次。 如果想尝试其他的数据集,可以访问这里: ?/data/list/?q=provider:tsdl 可以很明显的看出,airline passenger的数据是很有规律的。 time series data mining 主要包括decompose(分析数据的各个成分,例如趋势,周期性),prediction(预测未来的值),classification(对有序数据序列的feature提取与分类),clustering(相似数列聚类)等。 这篇文章主要讨论prediction(forecast,预测)问题。 即已知历史的数据,如何准确预测未来的数据。 先从简单的方法说起。给定一个时间序列,要预测下一个的值是多少,最简单的思路是什么呢? (1)mean(平均值):未来值是历史值的平均。 ? (2)exponential smoothing (指数衰减):当去平均值得时候,每个历史点的权值可以不一样。最自然的就是越近的点赋予越大的权重。 或者,更方便的写法,用变量头上加个尖角表示估计值 (3) snai

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档