- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
作者简介:王伟晶,1988年出生,女,籍贯:山东烟台,职称:助教,学位:硕士,研究方向:偏微分方程,署名单位:天津农学院,邮编:300384,联系方式:。
基于BP神经网络预测股票的涨跌趋势
王伟晶
天津农学院 (天津 300384)
摘要:本文首先阐述了BP神经网络的算法原理,然后结合数据分析软件R中进行金融分析的加载包quantmod来采集上市公司的股票数据,并利用R软件中专门提供BP神经网络算法的加载包nnet对所采集的股票数据建模,最后利用建立的模型对后续几天的股票数据进行预测。
关键词:神经网络;股票市场;预测;R;nnet
一、引言
股票市场受到多种因素的影响,导致股票的价格走势是随机的、非线性的。股票价格的变化具有高噪声和非线性的特点,这些特点导致传统的统计方法在预测股票价格走势时具有局限性。而神经网络具有任意逼近非线性函数的能力以及对信息处理的综合能力,使得神经网络可以有效的用于预测股票价格的走势。
神经网络起源于生物学中有关神经元的研究。神经元主要通过其本身的神经突触来接受外部信息,这些突触进行连接并相互传递信息,从而才能实现人脑的行为。因此,人工神经网络就是使用一套函数模型来模拟这些相互连接的神经元,它既可以对连续型目标变量做回归分析,也可以对分类型目标变量做分类分析。BP神经网络是在各行业中得到广泛应用并且试验效果良好的人工神经网络模型,下面将利用BP神经网络建立股票涨跌的预测模型,最后使用测试样本来对所建立的神经网络模型的推广能力进行检验。
二、算法说明
BP神经网络是Rumelhart等人在20世纪80年代提出的,其特点是在训练模型的过程中采用了误差反向传播的方法,是目前主流的神经网络模型。BPBP算法的学习规则为采用最速下降法,通过误差的反向传播来调整整个网络的权值,从而使网络模型的误差平方和达到最小。在实际应用和理论研究中,最常使用的是三层前馈反向传播神经网络,它是具有线性输出的单隐含层网络。
BP算法学习过程包括两部分,一部分是信息的正向传播,另一部分是误差的反向传播。在正向传播的过程中,首先信息进入输入层,然后经过隐含层单元并最终传输到输出层。如果输出层输出与期望不符,则模型进入反向传播部分,即将误差信息按原来的链接通路原路返回,并修改各层间神经元权值最终使误差达到最小。
图1 单隐含层BP网络
图1中给出了一个单隐含层的BP神经网络模型,这个神经网络中包含个输入层单元,个隐含层单元和个输出层单元,其中表示第个输入层单元的输入变量,表示第个隐含层单元的输出变量,表示第个输出层单元的输出变量。从输入层单元到隐含层单元的链接权重为,从隐含层单元到输出层单元的链接权重为。表示作用在隐含层和输出层单元上的激活函数,这个函数是单调函数。训练BP网络的算法描述如下:
在正向传播部分,输入层单元对所有的输入变量不做任何数据处理,只是负责把每个输入变量和隐含层中的所有神经元连接起来。所以输入层单元的输出为。
隐含层单元的输入需要将所有的输入层输出做加权之后再求和,记为
由于隐含层单元需要对所有的输入使用激活函数,因此隐含层单元的输出为,其中函数为激活函数。
输出层单元的的输入,同样要对隐含层单元中的输出进行加权求和,记为
使用激活函数后,输出层单元输出为 ,其中函数为激活函数。
在反向传播部分需要分别计算输出层单元的误差和隐含层单元的误差,并以此来修改输入层与隐含层之间的权重以及隐含层和输出层之间的权重。
输出层单元的误差为
,
隐含层单元的误差为
,
输出层单元和隐含层单元之间的权重公式修改为
,
输入层单元和隐含层单元之间的权重公式修改为
,
其中为争相传播部分输出层单元计算出的输出,是训练样本中目标变量的实际取值。为学习步长值,的取值大小会影响网络的收敛速度。
三、样本的选取和规范化
1、样本和样本变量的选取
样本的选取问题是模型建立中首先要解决的问题,股票市场的样本数据应尽可能的反映交易规律。因此本文选取了博信股份(股票代码:600083)自2012年1月1日到2014年11月20日合计752个工作日的上证指数来作为研究数据的样本。使用R软件中的quantmod金融分析包来采集数据,并取当日交易中的今日开盘价、今日最高价、今日最低价、今日收盘价和今日交易量5个指标作为样本的变量[1]。
2、样本的规范化
BP神经网络对样本中各个变量的尺度敏感。如果某一个变量的量级过大,那么一方面会导致神经网络收敛慢、训练时间长;另一方面,由于量级大的变量在反向传播部分的权重中作用会偏大,而量级小的变量在反向传播部分的权重作用就会偏小,这就导致量级大的变量产生的影响比其它量级小的变量产生的影响大得多,使得其他的变量丧失了对模型调控的作用。所以很有必要对原始样本进行规范化处理,本文使
您可能关注的文档
最近下载
- 机器人常用手册_epx系列epx1250使用说明书.pdf VIP
- 平行线分线段成比例定理.ppt VIP
- 《临床试验生物样本伦理管理指南》.pdf
- 妊娠期间孕妇心理护理.pptx VIP
- 2025山东威海热电集团有限公司招聘37人考试备考题库及答案解析.docx VIP
- 2025山东威海热电集团有限公司招聘37人笔试参考题库附答案解析.docx VIP
- 2025山东威海热电集团有限公司招聘37人笔试备考试题及答案解析.docx VIP
- 2025山东威海热电集团有限公司招聘37人笔试模拟试题及答案解析.docx VIP
- 伤口造口失禁专科护士.docx VIP
- 伤口造口专科护士试题 造口试题 .pdf VIP
文档评论(0)