- 1
- 0
- 约5.2千字
- 约 90页
- 2019-02-28 发布于湖北
- 举报
时间序列472482886资料
第一章 时间序列分析基本知识 中山大学医学统计与流行病学系 张 晋 昕 统计分析的数据 静态数据(static data) 动态数据(dynamic data) 时间序列分析(time series analysis) 建立数学模型,从数量上揭示某现象的发展变化规律或者从动态的角度刻画某现象与其他现象之间的内在数量关系,以便认识客观事物、预测其未来的变化趋势。有时还可以依据事物相互作用机制,作出针对性的调整,从而达到改造客观之目的。 时间序列的定义 医学科研工作中,按一定时间间隔(常为等间距)对客观事物进行动态观察,由于随机因素的作用,各次观察的指标 都是随机变量,这种按时间顺序排列的随机变量(或其观测值)就是时间序列。 图1.1 某医科大学附属医院1980年~1999年逐月出院患者数 时间序列与随机过程 一般来说,时间序列中各变量值无法用确定的函数形式表达,各时刻的观测结果可视作随机因素作用下的变量,当 时,变量集合 ,常被称作随机过程,实际工作中的实测值序列则被称作随机过程的一次实现。其中,参数t可以是时间,也可以是其他有序变量,如空间位置、温度水平等。 1.1 时间序列的分解 (1)趋势性(Trend) (2)季节性(Seasonal Fluctuation) (3)随机性(Irregular Variation) “加法式” 与 “乘法式”迭加 分离出趋势项和周期项后,时间序列往往表现为平稳波动。 借助时间序列进行预测的依据 平稳化后的时间序列历史值 中往往含有 的信息,这就使得利用历史样本 预测所关心指标将来的取值水平成为可能。 1.2 指数平滑法 对于事物未来发展的水平,新近观测值比早期观测值的预测价值更大,因而在预测时,新近观测值应比早期观测值具有更大的权重。 典型案例 指数平滑预测的通式 St —— 第t期平滑值(t 0); —— 平滑系数(取值范围); xt —— 第t期实际观察值。 拟合过程 S1 = 355.19 S2 = 0.2×x1+0.8×S1 = 0.2×371.5+0.8×355.19 = 359.17 S3 = 0.2×x2+0.8×S2 = 0.2×267.4+0.8×359.17 = 340.82 …… 当前平滑结果与历史值的关系 …… 代入下式 , 当 时, ,系数之和→1。 指数平滑法实现预测的本质意义 权重系数的特点 α界于(0 ~ 1.0)之间。 如果要求模型有较高灵敏度,能够迅速跟踪新数据的变化,权重系数可取?一些;如果要求模型不要被随机扰动影响太大,权重系数可选?一些,使预测结果更主要地取决于历史情形。 平滑系数α的确定 —— 误差极小原则 一期预测误差平方 平均平方误差 平均绝对误差 拟合效果与预测效果 对历史值的拟合效果好 对未来值的预测效果好 1.3 ARIMA模型 ARIMA模型是由Box和Jenkins(1970)提出的一套比较成熟的时间序列建模方案,他们定义了建模的三个主要阶段: 识别 估计 诊断 “时序”建模的三个阶段 (1) 模型识别 就是根据时间序列的特点,选择一个已有的模型类别来描述,然后确定选入模型的参数数量和种类,以及它们的组合方式。 (2) 参数估计 就是估计模型中的参数,并作假设检验,使模型与实际数据相匹配。 (3) 模型诊断 检验模型与实际数据的匹配程度。 典型案例 时间序列的平稳性 ——严平稳 时间序列的平稳性 ——宽平稳 平稳性的判断 (1)数据图检验法 (2)自相关、偏自相关函数检验法 (3)特征根检验法 (4)参数检验法 (5)逆序检验法 (6)游程检验法 (1)数据图检验法 平面直角坐标系中将所研究的时间序列绘成线图,观察其是否存在周期性或趋势性。若周期性和趋势性均不明显,就认为序列是平稳的。 这种方法具有简单、直观、运用方便等优点,但是对图形的观察要靠实际经验,不同的分析者可能得出不同的结论。
原创力文档

文档评论(0)