- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学建模·中国GDP趋势的分析与预测_2
基于多项式模型GDP趋势的预测与研究
摘要:国内生产总值(GDP)是现代国民经济核算体系的核心指标,是衡量一个国家综合国力的重要指标。本文就1800年到20年的生产总值(GDP)等相关统计数据,建立了GDP的点点对应关系图形,大致观察出点点之间的变化趋势,之后预测出年份与关系y=a*exp(x+b)。利用matlab软件对函数拟合求出相应的参数在之后几年里的多少模型的可靠性和可用性该指数模型,寻找适当的自变量,建立如(1-1)的理论模型
2、估计参数:运用普通的最小二乘法或其他方法评估参数的值,建立如下的一元线性回归预测模型: ( i=0,1,...,n) (1-2) 这里分别是的估计值。如果是采用最小二乘法估计的值,即时残差平方和(也称剩余平方和)
3、进行检验:回归模型建立之后,能否用来进行实际预测,取决于它与实际数据是否有较好的拟合度,模型的线性关系是否显著等。为此,在实际用来测量之前,还需要对模型进行一系列评价检验。
1)、标准误差
标准误差是估计值与因变量值间的平均平方误差,其计算公式为:
(1-4)
它可以用来衡量拟合优度。
2)、判定系数
判定系数是衡量拟合优度的一个重要指标,它的取值介于0与1之间,其计算公式为:
(1-5)
越接近于1,拟合程度越好;反之越差。
3)、相关系数
相关系数是一个用于测定因变量与自变量之间线性相关程度的指标,其计算公式为
(1-6)
相关系数与判定系数之间存在关系式:
但两者的概念不同,判定系数用来衡量拟合优度,而相关系数用来判定因变量与自变量之间的线性相关程度。
相关检验要利用相关系数表,步骤如下:
首先计算样本相关系数值。然后根据给定的样本容量和显著性水平查相关系数表,得临界值,最后进行检验判断:
4)、回归系数显著性检验
回归系数的显著性检验可用检验法进行,令
(1-7)
取显著性水平,则回归系数显著,此检验对常数项亦适用。
5)、检验
统计量
(1-8)
服从分布,取显著性水平,则表明回归模型显著;如果,则表明回归模型不显著,改回归模型不能用于预测。
6)、统计量
统计量是用来检验回归模型的剩余项之间是否存在自相关的一种十分有效的方法。
(1-9)
式中
将利用式(1-9)计算而得到的值与不同显著性水平下的值之上限和下限进行比较,来确定是否存在自相关。值应在之间。
根据经验,统计量的值在之间时表示没有显著自相关问题。
以上检验可利用统计软件包进行回归时同时完成
4、进行预测:预测可分为点预测和区间预测两类,在一元线性回归中,所谓点预测,就是当给定时,利用样本回归方程求出相应的样本拟合值,以此作为因变量个别值和其均值的估计。
区间预测是给出一个在一定概率保证程度下的预测置信区间。进行区间预测,首先要进行点预测,确定的值,求得的预测值。的置信度为的预测区间的端点为: (1-10)
2.2 ARIMA模型建模步骤
2.2.1 数据平稳化处理[2]
首先要对时间序列数据进行平稳性检验。可以通过时间序列的散点图或折线图对序列进行初步的平稳性判断。一般采用ADF单位根检验来精确判断该序列的平稳性。对非平稳的时间序列,我们可以先对数据进行取对数或进行差分处理,然后判断经处理后序列的平稳性。重复以上过程,直至成为平稳序列。此时差分的次数即为 模型中的阶数。从理论上而言,足够多次的差分运算可以充分地提取序列中的非平稳确定性信息。但应当注意的是,差分运算的阶数并不是越多越好。因为差分运算是一种对信息的提取、加工过程,每次差分都会有信息的损失,所以在实际应用中差分运算的阶数要适当,应当避免过度差分,简称过差分的现象。一般差分次数不超过2次。
2.2.2 模型识别
在平稳时间序列自相关函数和偏自相关函数上初步识别模型阶数和,然后利用AIC定则准确定阶。AIC准则[3]:最小信息准则,同时给出模型阶数和参数的最佳估计,适用于样本数据较少的问题。目的是判断预测目标的发展过程与哪一随机过程最为接近。因为只有当样本量足够大时,样本的自相关函数才非常接近母体的自相关函数。具体运用时,在规定范围内使模型阶数从低到高,分别计算AIC值,最后确定使其值最小的阶数是模型的合适阶数。关于模型,AIC函数定义如下: 式中:平稳序列为样本数,为拟合残差平方和,,为参数。
AIC准则定阶方法可写为:其中:,为模型阶数的上限值,一般取为根号或。实际应用中,一般不超过2。
2.2.3 参数估计
确定模型阶
文档评论(0)