- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVM上证指数预测研究
基于SVM上证指数预测研究
摘 要:国家政策或市场经济导向等变动会对整个上证指数产生影响,为了寻找上证指数变化规律,提出基于支持向量机的预测算法。算法首先利用数据挖掘技术在某网站上挖掘相关的上证价格数据,并取一部分上证数据作为支持向量机的训练指数样本,得到支持向量机的训练指数集,然后在训练指数集上利用支持向量机,从而得到上证指数分类的超平面指数函数以及相关的上证指数样本集,最后对所得的上证指数分3个模型进行预测研究,得到下一个开盘日的上证指数变动预测数据。实验结果表明,预测2天后的上证指数趋势只需要前3天的数据作为自变量输入即可,且所得预测值与实际数值的误差率较低。
关键词:上证指数;SVM;数据挖掘;股票预测
DOIDOI:10.11907/rjdk.171351
中图分类号:TP319
文献标识码:A 文章编号文章编号:1672-7800(2017)008-0156-04
0 引言
影响上证指数变化的因素诸多,比如企业交易、市场经济、国家政策导向、居民消费能力、国际交易信息、人民币汇率变化等,都会直接或间接地对上证指数变动产生影响。上述因素之间存在着彼此交叉影响,能够对上证指数进行有效预测,这对金融投资者、金融行业,乃至整个股票市场具有重要指导意义和实用价值。
目前,利用支持向量机对股票进行研究的文献不多。文献[1]利用回归预测法对股票进行了短期预测,取得了初步成果,但利用回归预测方法要求的变量多且难确定,所得预测效果不理想。文献[2]利用时间序列预测法对股票进行短期预测,也取得了一定的效果,但文献[2]并没有对股票变化的规律进行深入研究。文献[3]和文献[4]虽然利用SVM对股票进行了研究,但只是简单拿一些数据用SVM方法进行计算,并没有进一步研究用什么样的数据进行预测得到的效果最好。本文在文献[3]和文献[4]的基础上,利用SVM方法,通过对比不同时期的上证指数,并对下一个开盘日上证指数的变化值进行预测。实验结果表明,本文所得的预测结果与实际相差不大,具有一定的实际意义和指导价值。
1 支持向量?C
支持向量机[5-14]是在利用统计学分析数据时面对有限样本研究其性能不够高时提出来的新方法,其思路主要是寻找一个超平面,使得正反例之间的距离最大。本文借用支持向量机算法具体过程如下:
首先是训练上证指数集的选取,本文主要通过网络爬虫等数据挖掘软件,对某交易平台的上证指数数据进行挖掘,并对所得数据进行噪音等处理后作为训练指数集,即把所得上证指数数据作为训练指数样本集,设为:D={(xk,yk)|k=1,2,…,M,xk∈Rn,yk∈R}其中,xk表示上证指数输入数据, yk表示上证指数输出数据。其次是支持向量机相关参数选取。针对上述所得训练指数集,结合支持向量机的知识,本文得到关于原始上证指数数据的权ω空间中的上证指数函数求解方程:
minω,b,eJ(ω,e)=12ωTω+12γ∑Mk=1e2k(1)由于上述的权空间上证指数函数是非线性的,一般难以直接求解,目前对其求解的方法是直接转化为相对应的约束条件指数函数的最小值求解:yk=ωTφ(xk)+b+ek,(k=1,2,…,M)
其中: φ(.)代表核空间Rn维到Rm维的映射关系函数;ω是Rm维的权向量;ek是实数域范围内的误差变量;b代表偏差量; γ代表可调节的参变量。为了求得约束条件价格函数的最小值或最优值,本文利用拉格朗日方法构造其拉格朗日上证指数函数方程为:L(ω,b,e,λ)=J(ω,e)-∑Mk=1λk{ωTφ(xk)+b+ek-yk}(2)
其中,λk为拉格朗日参数。根据式(2),利用拉格朗日求解的方法对拉格朗日上证指数函数L(ω,b,e,λ)关于所有参数ω、b、ek、λk进行偏导数求解,并令所有的偏导数为零,然后消去参量ω、e,从而得到最优分类上证指数函数方程,为了便于求解,用矩阵的形式给出其方程:
0ITIΩ+1γIbλ=0y(3)其中: x=[x1,…,xM],y=[y1,…,yM],I=[1,…,1],λ=[λ1,…,λM],Ωkl=ψ(xk,xl)=φT(xk)φ(xl),(k,l=1,…,M)。针对式(3)中的Ωkl条件,本文利用mercer条件[15]可知,必有一个映射函数φ和一个核函数ψ(,)使得等式ψ(xk,xl)=φT(xk)φ(xl)成立。综上所述,本文得到上证指数函数估计的方程为:
y(x)=∑Mk=1λkψ(xk,xl)+b(4)
其中,α、b和λk利用式(3)求解。若所求得的λk不为零,则其对应的指数样本集就可以作为支持向量机的训练指数集;若所求得的λk为零,可以适当采取改变松弛变量γ的取值或者改变核函数ψ(,)的选取,再进行验算
您可能关注的文档
最近下载
- 高中数学人教A版(2019)选择性必修第一册知识点归纳含答案.pdf VIP
- 农村污水治理工程施工方案与技术措施.pdf VIP
- 关于马克思主义环境法思想探究.doc VIP
- 越众集团2012年招聘简章.doc VIP
- 酒店装修施工组织设计.doc VIP
- 半导体光电子器件全套教学课件.pptx
- 日语初级~阅读理解.pdf VIP
- 人教版九年级数学第二十四章《圆》单元知识点总结.doc VIP
- 2022-2028全球及中国化学水处理设备行业研究及十四五规划分析报告.docx VIP
- CISSP Official (ISC)2 Practice Tests英文(第3版)考试认证文档p.pdf VIP
文档评论(0)