- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R语言在ARIMA模型中的运用.doc
R语言在ARIMA模型中的运用
摘要:近年来人们生活水平显著提高,对于旅游也是愈发的追求。利用R语言时间序列模型ARIMA建立的相关理论知识,对某旅游景点的各个季度旅游收入进行非平稳时间序列模型建立并进行检验,从而将模型加以推广,对旅游景点的未来收入进行预测,从而对景点的安排和规划提出合理建议。
关键词:ARIMA模型;平稳性;检验;R语言
一、模型的基本原理
ARIMA模型是自回归积分移动平均模型,但大量的数据都会存在一定的季节性波动性,为此需要对数据进行增长性d阶差分运算以及季节性差分等,从而使得模型可以得到一个平稳的时间序列,建立ARIMA(p,d,q)模型:
[(1-B)dxt=c+[θ(B)φ(B)]εt] (1)
其中式中[φ(B)]平稳的自回归滞后算子多项式,[φ(B)]是可逆的移动平均滞后算子多项式,d为差分的次数,{[εt]}是服从正态分布平稳的白噪声序列。
二、模型建立的基本思路
先做出原始数据的时序图,看原始数据的趋势是如何的,是否是增长,有异常值以及有季节季度因素的影响等,对原始数据进行d阶差分以及季节性四步差分等,之后利用ADF单位根检验进行差分后的数据是否为平稳的时间序列;数据平稳后再对差分处理后的数据求出其自相关图和偏自相关图,通过分析其截尾性和拖尾性来判断ARIMA模型p,q的阶数;通过对模型组合的不断尝试,利用AIC准则寻找到最理想的模型,再对模型的参数进行t检验以及对残差进行Ljung-Box检验,看残差是否符合白噪声检验。通过不断尝试,最终得出通过检验的模型的最终表达形式,并对未来的几期做出相应的预测,对模型进行推广,以及给出合理性建议。
三、具体建模过程分析
(一)数据的处理
选取某旅游景点1999年1季度到2006年4季度的数据,做出时序图,结果如下图1:
图1 原始折线图
图1显示的是原始数据的时序图,由上图可以看出中间部分出现了与前几年不同的收入骤减的情况,我们将其理解为异常值,对建模有一定的干扰,于是利用对异常值的处理方法,用平均数代替异常值;之后又看出收入有明显的增长模式,并且有在波动上具有季节性,故先对数据进行一阶差分运算,但是仍然有季节性的影响因素,所以再对差分后的数据再通过4步差分来消除季节变动,得到最终平稳的时序图如图2:
图2 最终平稳时序图
(二)平稳性检验
从时序图来分析,数据经过多次处理后已经趋于平稳了;对于序列的是否平稳,采用的R语言的ADF.test的命令:标准是如果检验出来的结果p值小于0.05,则拒绝原假设,不存在单位根,即序列经过处理后是平稳的;否则,说明数据不平稳,还需要再处理。由ADF检验可以得出p值等于0.01小于0.05,拒绝原假设,即通过一阶差分和四步差分后得到的是平稳的数据。
(三)模型阶数的大致判断
接着对处理后的平稳数据进行ACF(自相关图)和PACF(偏自相关图)分析,程序运行结果如下:
从图上看出,自相关系数一阶截尾,偏自相关系数一阶截尾,初步认定p和q 都是一阶,考虑建立p=1,q=1的ARIMA模型。
(四)参数估计以及模型的选定
(1)首先尝试ARIMA (0,1,1)以及加上季节因素的SARIMA模型, 再尝试ARIMA (1,1,1)以及加上季节因素的SARIMA模型
对以上两个模型运行结果分析:虽然模型2相对于模型1的AIC统计量有了一定的减少,但是sma1的系数通过t检验后不显著,故不SARIMA模型的效果并不是特别好,故使用ARIMA对模型进行拟合,例如使用ARMA(1,1)以及ar(1),ma(1)等模型再进行验证。
(2)建立p=1,q=1的ARMA(1,1)模型, 同时建立MA(1)模型,运行结果如下:
通过对上述两个模型的相关统计量的比较,我们可以看出:MA(1)模型的AIC相对于ARMA(1,1)模型而言有着一定的减少,可见模型优化了。另外ARMA(1,1)模型的ar(1)的系数没有通过t检验量,故我们选择MA(1)模型,并对它进行残差的检验。
(3)对于残差的检验
检验的是此模型建立后的拟合的残差即随机干扰项是否是白噪声序列,对此,我们利用的是R语言中的tsdiag0命令,对残差进行Ljung-Box检验,运行的结果如下:
从检验的结果可以看出:残差之间不存在自相关性,且Ljung-Box检验的p-value中各点都在虚线的上方。所以看出随机干扰项是白噪声。故处理后的平稳时间序列模型为ARIMA(0,1,1),通过检验可用。
(4)最终的模型结果
综上,我们对1999年到2006年某市的
您可能关注的文档
- ICU呼吸机相关性肺炎危险因素分析.doc
- ICU护生睡眠状况调查.doc
- ICU机械通气肺部感染的临床护理对策.doc
- ICU气管插管清醒患者心理分析及护理干预.doc
- ICU预防呼吸机相关性肺炎的护理新体会.doc
- IMF中国处前处长普拉萨德:全球金融危机不会出现.doc
- IUC患者肠内营养并发症的原因分析及护理.doc
- KIVA和Extricom系统使智能仓储变为现实.doc
- KJ751泵站监控系统在大平矿的应用.doc
- Leep刀治疗宫颈病变的效果评价.doc
- 数据仓库:Redshift:Redshift与BI工具集成.docx
- 数据仓库:Redshift:数据仓库原理与设计.docx
- 数据仓库:Snowflake:数据仓库成本控制与Snowflake定价策略.docx
- 大数据基础:大数据概述:大数据处理框架MapReduce.docx
- 实时计算:GoogleDataflow服务架构解析.docx
- 分布式存储系统:HDFS与MapReduce集成教程.docx
- 实时计算:Azure Stream Analytics:数据流窗口与聚合操作.docx
- 实时计算:Kafka Streams:Kafka Streams架构与原理.docx
- 实时计算:Kafka Streams:Kafka Streams连接器开发与使用.docx
- 数据仓库:BigQuery:BigQuery数据分区与索引优化.docx
文档评论(0)