- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于量价特征分析的股票分类识别.doc
基于量价特征分析的股票分类识别
摘要 : 该文介绍一种基于量价特征分析的股票分类识别模型,该模型可输出与输入股票走势相近的同类股票。在证券市场,同一板块或同一概念的股票在一定时间内都会表现出相近的走势。对相近走势股票进行计算机自动分类识别,不仅减轻了手工分类的工作,还能从同类股票中找到盈利机会。
关键词: 量价分析;股票分类;模式识别
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)30-6874-03
如何准确地对股票进行分类识别一直是一个热门的证券研究话题。在国外,常用的方法如:人工神经网络(ANN)、支持向量机等常常出现在股票识别、走势预测的论文中。在国内,有不少学者使用时间序列、人工神经网络、模糊时间序列等方法研究股市,并取得了一些成果。
上述方法各有所长, 却各有不足之处。它们在股票分类识别应用中的最大不足便是重用性差[1],例如神经网络模型需要做预先训练来最优化参数,因此训练的结果往往不适用于其它数据。比如我们训练一个神经网络来识别银行板块的股票,训练好的神经网络模型却不能用来识别煤炭板块的股票。
结合上述模型的优点,通过股票技术分析与模糊逻辑的理论方法建立一个基于量价特征分析的股票分类识别模型。模型的优点是:(1)模型重用性高,可将某一板块训练得到的模型应用于其他不同板块;(2)利用均线系统与模糊逻辑方法降低了数据噪声影响;(3)模型分类结果直观易理解,通过对识别后的同类股票盯梢,可以在某只股票率先上涨后立刻购入与其同类的未涨股票,以此获利。
1 模型介绍
量价分析是分析价格、交易量两者之间关系的技术分析方法。模型立足于股票量价分析,目标在价格和成交量的时间序列中找到一定的规律,并根据这些规律找到相同规律的股票。模型通过分析股票的价格距离、走势特征、成交量特征来完成对同类股票的识别。
1.1 价格距离
价格距离是指两个股票间价格的欧式距离。但由于不同股票的发行价格不同、且存在除权的影响,所以不能直接拿两个股票进行价格距离计算,而应取经归一化处理后的复权价格数据来建模计算。同时为了降低数据噪声影响,模型采用收盘价的3日移动平均值(下文简称:MA3值)代替日收盘价。在数据长度上,选择200天的交易数据,因为200天接近一年的总交易日,已经足够反应两只股票间的走势是否相近,并可据此判断他们是否属于同一类股票。
在计算价格距离前,还需要考虑日期对齐问题。在股票市场,上市公司遇到重大事项,常常会向交易所申请停牌。由于可能存在交易停牌,所以在计算价格欧式距离前必须先对齐价格数据的日期。交易日期对齐后,若某日缺少价格数据,则当日价格距离等于最后总距离的平均值。当对齐后缺少价格数据的天数超过一定数值(一般取24天),则失去价格距离计算的意义。如果仍要进行股票间的价格距离计算,只能另选满足长度要求的数据。
两个股票间价格距离的详细计算流程如下:1.取两只股票最近200日的交易数据,2.将交易数据的日期对齐;3.判断对齐后的数据是否满足模型计算要求;4.计算股票收盘价的MA3值;5.将MA3值归一化;6.计算股票间的价格距离。
1.2走势特征距离
单纯依靠计算两股票间的价格距离并不能知道两股的走势是否相近,如图1中两个股票的价格欧式距离接近,但走势不同。所以要判断两个股票是否属于同一类型,除了计算股票间价格距离外,还必须计算两个股票的走势特征距离。
股票走势分上涨、下跌、平缓三种,如何定义这三种走势是计算走势特征距离的关键。经过实验统计,模型将股票的三种走势分别定义如下:(1)上涨走势:MA3值累计上涨超过3%为上涨走势;(2)下跌走势:MA3值累计下跌超过3%为下跌走势;(3)平缓走势:非上涨、下跌的走势统称平缓走势(技术分析又称之为横盘走势)。
据此定义的走势分布如图2下的走势统计图所示,在统计时间(2013年1月30日——2013年7月8日)内的所有股票走势中,44.7%为平缓走势,而下跌、上涨走势分别为28.7%和26.6%。从图2上的单日MA3涨跌统计图可以看到,单日便形成上涨、下跌走势的交易日不足10%,也就是说走势的确立主要依靠数日的走势累积来完成,这也符合股票实际运行规律。
在计算走势特征距离时,还需考虑如何降低噪声影响,例如由于某日暴涨形成上涨走势后在次日回落形成平缓走势甚至下跌走势,这种单日暴涨形成的上涨走势便是噪声。为了降低噪声影响,模型将三种走势分别细分成:走势初成、走势延续、走势结束三种,最后将所有9种分类通过模糊逻辑的方法将其模糊化以降低走势特征的噪声影响。在模糊化时,根据统计结果,让这9种走势类型相互覆盖,以减少波动噪声对整体走势计算的影响。
1.3成交量异动特征
您可能关注的文档
- 基于精确雨量监测的汛期城市管理工作特征分析.doc
- 基于纵向合作的技术标准研发决策分析.doc
- 基于组合赋权的城市轨道交通车辆产业集群发展评价模型及中国实证.doc
- 基于组态软件的柴油发电机组远程监控系统设计.doc
- 基于继电保护本科教学的探索与研讨.doc
- 基于绩效技术的混合学习教学设计与应用研究.doc
- 基于网格技术的电力信息资源整合方案分析.doc
- 基于网络环境下计算机文件信息安全的研究.doc
- 基于网络的学生成绩管理系统的设计与实现.doc
- 基于网络的无纸化考试系统的研究与实现.doc
- 新高考生物二轮复习讲练测第6讲 遗传的分子基础(检测) (原卷版).docx
- 新高考生物二轮复习讲练测第12讲 生物与环境(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第3讲 酶和ATP(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第9讲 神经调节与体液调节(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第11讲 植物生命活动的调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第8讲 生物的变异、育种与进化(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第5讲 细胞的分裂、分化、衰老和死亡(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第5讲 细胞的分裂、分化、衰老和死亡(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第12讲 生物与环境(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第11讲 植物生命活动的调节(检测)(原卷版).docx
文档评论(0)