基于卷积和循环神经网络模型融合的股票开盘价预测研究.docxVIP

基于卷积和循环神经网络模型融合的股票开盘价预测研究.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于卷积和循环神经网络模型融合的股票开盘价预测研究

赵浩博李锡祚

摘要:本文提出了一种利用股票价格和相关新闻数据,基于卷积和循环神经网络模型

融合的股票开盘价预测研究方法。针对股票开盘价预测的问题,考虑到股票相关信息的时

序性以及新闻影响的持续性特点后,首先使用向量表示方法将新闻数据转换成向量,再利

用卷积神经网络模型提取出股票相关的新闻文本特征,同时使用循环神经网络模型对股票

价格数据进行训练,最后将新闻特征向量和价格训练后得到的向量合并,得到股票信息的

低维向量表示并输入到深度神经网络中,利用深度神经网络对股票开盘价进行预测。本文

实验中使用的数据是美股道琼斯指数与相关新闻,实验结果表明,本文所提出的方法在股

票开盘价预测上具有明显的优越性。

关键词:股票开盘价预测;卷积神经网络;循环神经网络;深度学习

0引言

金融市场是国家金融体系的重要部分,对于一、二级市场的参与者来说股票价格的分

析预测是其做出正确判断与决定的重要参考,因此预测其价格也让大量的专家学者为之着

迷。在全球化的股票市场中,市场的行情与国家经济大环境、法律法规、企业经营情况、

投资者信心、新闻舆情等都有所关联,股市行情具有高度的波动性与不确定性,使其成为

金融与计算机领域研究中的一大难题。

由于公司报表、报刊和舆论媒体等文本信息的快速增长与积累,可用于分析的数据样

本也在逐渐丰富,数据数量也在不断地增加。在股票价格的预测中,如何使用文本数据来

让模型的表现得到提升,在近些年的股市预测中一直是关注的热点。资本市场相关的数据

信息通常可以反应股票价格波动,并且数据信息分析相比传统的K线分析更具有广度和深

度。同时,随着AI领域的持续发展,机器学习和深度学习等人工智能技术在众多研究领

域和实际场景中得到了广泛的应用,自然语言处理领域也因为深度学习的兴起得到了发展

和进步,这些技术上的突破均使得股票预测模型的建立有了更大的上升空间。

在过往的研究中,线性回归、遗传算法、SVM、决策树这些机器学习算法以及深度学

习网络模型都被大量用在股票预测的研究之中。在文献中作者将多种机器学习算法与卷积

神经网络(CNN)在股票预测中的表现进行了比较,证明了卷积神经网络模型在股票预测

上的准确率优于传统的机器学习算法。而在文献中,作者利用tensorflow框架搭建了多

层神经网络(MLP)来对股票的价格进行预测,最终通过与传统的BP神经网络方法对比,

说明了合适的神经网络结构有利于提高网络模型预测的准确率,同时还能有效减少预测耗

时。

基于深度学习在股票预测中的优良表现和循环神经网络在序列数据预测中的特殊性,

本文提出了一种基于卷积和循环神经网络模型融合的股票开盘价预测研究方法。在股票的

数据选取方面包含了历史价格和相关新闻,新闻的特征提取用到了word2vec和CNN方法。

在训练模型上,由于股票价格是时间序列数据,具有时序性,同时新闻对股价的影响具有

持续性,所以本文采用的训练模型是卷积神经网络和循环神经网络。

1相关技术

1.1Word2Vector

在神经网络等机器学习和深度学习模型中,无法直接处理字符串类型的数据,因此需

要将其转换为纯数字信息。在转换过程中,应尽可能保留数据原始信息。

Word2Vector与One-hot类似,是一种将文本数据转换为矢量的模型,广泛用于自然

语言处理(NLP)中。One-hot对文本中的所有单词进行计数,然后对于每个词汇表编号,

为每个单词创建N维向量。向量的每个维度代表一个单词,因此对应的数字位置中的维度

值为1.其它维度均为0。虽然此方法保留原始单词信息,但在文本数量多的情况下维度太

高,而且不能反映两个词之间的关系。例如,猫和小猫明显比猫和珊瑚更接近,但其却在

单词向量表示中无法得到体现。相比于One-hot的编码方式,Word2Vector通过学习文本,

使用单词向量来表示单词的语义信息,通过将单词向量“嵌入空间”(嵌入就是将原始单

词所在的空间映射到新空间),达到语义相似的单词之间距离接近的目的。这样便可以降

低维度并反映单词和单词之间的关系。

在Word2Vector方法中,主要有Skip-Gram和CBOW两种模型。从直观上理解,CBO

文档评论(0)

192****4552 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档