基于ARMA平稳时间序列机票价格预测模型.docVIP

基于ARMA平稳时间序列机票价格预测模型.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于ARMA平稳时间序列机票价格预测模型

基于ARMA平稳时间序列机票价格预测模型   摘要:伴随着网络订票平台的普及,越来越多的人选择这些平台来订购飞机票,然而航空公司会根据自己的一套复杂定价机制随时调整机票价格,机票的价格波动幅度比较大。文章基于山海关机场的某航线,连续追踪了半年的数据建立了时间序列模型,并给出了预测机票价格的ARMA模型,为顾客节省费用提供了一定的理论依据以及实际帮助。   关键词:机票价格;价格预测;ARMA模型;山海关机场;时间序列模型 文献标识码:A   中图分类号:TP393 文章编号:1009-2374(2016)05-0019-02 DOI:10.13535/j.cnki.11-4406/n.2016.05.010   1 概述   航空公司根据收益管理系统进行实时价格调整,票价变化明显,所以机票价格浮动大这一特点使价格预测极具实际应用价值。目前,国内针对机票价格预测模型的研究多在超售模型、价格走势规律、航空公司定价机制等方面。而国外已有如FareCast和FareCompare等成熟的机票价格预测工具,是机票价格预测和追踪网站中的佼佼者。由于国内的航空公司使用的收益管理与国外有所不同,导致国外的预测方式大多不适合国内的机票价格变化。在此基础上,国内有许多学者对机票价格的预测进行了研究。顾兆军以北京首都机场某航线为例,主要从飞机的离港时间入手,结合时间序列算法建立了机票的价格预测模型;陈岩松主要从技术层面利用垂直搜索技术和HBase分布式数据库建立了机票价格预测系统;黄承真主要从云计算的视角,利用Hadoop的任务分配策略从技术层面上建立了机票价格预测的模型。   本文将在此基础上以国内航线为例,研究某既定日起飞的航班机票在预售期内的价格浮动,利用时间序列算法建立某既定日期与航班的机票在未来几天内的价格走势预测模型。   本文的组织结构如下:第一部分为理论基础,介绍了时间序列的重要概念和定义,并引入了ARMA模型的基本理论;第二部分为模型建立,从数据预处理,包括缺失值的填补和异常值的剔除,并从数据的平稳性及随机性的检验、模型识别、参数估计和检验详细介绍了整个模型的建立过程;第三部分为模型预测,通过建立的ARMA模型预测未来5期的机票价格,并与实际值进行对比确定误差率;第四部分为模型结论,总结了本文对于基于ARMA模型的机票价格预测所做的工作,并指出了模型的优缺点,对未来的研究工作提出了建议。   2 理论基础   在统计研究中,常用按时间顺序排列的一组随机变量表示一个随机时间的时间序列,简记为或。对于一个时间序列来说,通过平稳性检验可以分为平稳序列和非平稳序列两大类。对于平稳序列而言,我们已经有一套非常成熟的平稳序列建模方法。在统计上,通常可以建立一个线性模型来拟合该序列的发展,并借此提取该序列中的额有用信息。其中ARMA(auto regression moving average)即自回归移动平均模型是目前最常用的平稳序列拟合模型。   一般而言,我们把具有如下结构的模型称为自回归移动平均模型,简记为ARMA(p,q):若=0,该模型称为中心化ARMA(p,q)模型。特别是当q=0时,ARMA(p,q)模型就退化成了AR(p)模型;当p=0时,ARMA(p,q)模型就退化成了MA(q)模型。   3 模型建立   3.1 模型假设及数据搜集   由于当今网络订票平台的普及,人们可以提前数天就预订飞机票。而由于种种原因,机票的价格始终在不断波动,即某天的机票在航班起飞之前会有不同的价格。为了方便模型的建立,我们考虑如下假设:(1)机票的最低价必然出现在飞机起飞之前的30天内;(2)顾客没有航班偏好性以及时段偏好性,购买机票时始终以“最便宜”为目的;(3)机票价格在一天内保持不变;(4)飞机航班始终能满足顾客需求。   在此基本假设下,我们利用网络爬虫在去哪儿、携程等多个网站获得了山海关机场从秦皇岛飞往石家庄半年的数据。而同时为了反映同一天机票价格在不同预订时期的变动,我们对连续30天的数据取算术平均值,进行模型的建立。   3.2 数据预处理   数据预处理主要可以分为三部分:数据清洗、异常值剔除、缺失值的填补。   由于机票价格数据是通过网络爬虫在网络订票平台获取的,因此会出现数据冗余、无关数据等问题,我们首先需要对数据进行基本的数据清洗。   对于清理之后的数据,我们要识别出时间序列的异常值。考虑到进行时间序列建模时在模型定阶上我们很大程度上地参考了自相关图和偏自相关图的拖尾性和结尾性,而其判断标准为两倍标准差,即两倍标准差以外的值为异常值。利用这个原理,我们计算了时间序列观察值的Z分数,并剔除大于两倍标准差的数据。   对于缺失数据的处理一般有删除个案、删除缺失值等会丢失样本信息的方法,

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档