PyTorch+LSTM实现单变量时间序列预测.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

PyTorch+LSTM实现单变量时间序列预测

目录数据准备模型架构模型训练推理预测总结时间序列是指在一段时间内发生的任何可量化的度量或事件。尽管这听起来微不足道,但几乎任何东西都可以被认为是时间序列。一个月里你每小时的平均心率,一年里一只股票的日收盘价,一年里某个城市每周发生的交通事故数。

在任何一段时间段内记录这些信息都被认为是一个时间序列。对于这些例子中的每一个,都有事件发生的频率(每天、每周、每小时等)和事件发生的时间长度(一个月、一年、一天等)。

在本教程中,我们将使用PyTorch-LSTM进行深度学习时间序列预测。

我们的目标是接收一个值序列,预测该序列中的下一个值。最简单的方法是使用自回归模型,我们将专注于使用LSTM来解决这个问题。

数据准备

让我们看一个时间序列样本。下图显示了2013年至2025年石油价格的一些数据。

这只是一个日期轴上单个数字序列的图。下表显示了这个时间序列的前10个条目。每天都有价格数据。

datedcoilwtico

2013-01-01NaN

2013-01-0293.14

2013-01-0392.97

2013-01-0493.12

2013-01-0793.20

2013-01-0893.21

2013-01-0993.08

2013-01-1093.81

2013-01-1193.60

2013-01-1494.27

许多机器学习模型在标准化数据上的表现要好得多。标准化数据的标准方法是对数据进行转换,使得每一列的均值为0,标准差为1。下面的代码scikit-learn进行标准化

fromsklearn.preprocessingimportStandardScaler

#Fitscalers

scalers={}

forxindf.columns:

scalers[x]=StandardScaler().fit(df[x].values.reshape(-1,1))

#Transformdataviascalers

norm_df=df.copy()

fori,keyinenumerate(scalers.keys()):

norm=scalers[key].transform(norm_df.iloc[:,i].values.reshape(-1,1))

norm_df.iloc[:,i]=norm

我们还希望数据具有统一的频率在这个例子中,有这5年里每天的石油价格,如果你的数据情况并非如此,Pandas有几种不同的方法来重新采样数据以适应统一的频率,请参考我们公众号以前的文章

对于训练数据我们需要将完整的时间序列数据截取成固定长度的序列。假设我们有一个序列:[1,2,3,4,5,6]。

通过选择长度为3的序列,我们可以生成以下序列及其相关目标:

[Sequence]Target

[1,2,3]4

[2,3,4]5

[3,4,5]6

或者说我们定义了为了预测下一个值需要回溯多少步。我们将这个值称为训练窗口,而要预测的值的数量称为预测窗口。在这个例子中,它们分别是3和1。下面的函数详细说明了这是如何完成的。

#如上所示,定义一个创建序列和目标的函数

defgenerate_sequences(df:pd.DataFrame,tw:int,pw:int,target_columns,drop_targets=False):

df:PandasDataFrameoftheunivariatetime-series

tw:TrainingWindow-Integerdefininghowmanystepstolookback

pw:PredictionWindow-Integerdefininghowmanystepsforwardtopredict

returns:dictionaryofsequencesandtargetsforallsequences

data=dict()#Storeresultsintoadictionary

L=len(df

文档评论(0)

152****2468 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档