基于粗糙集的个股指标两步择优分析.doc

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于粗糙集的个股指标两步择优分析

天津财经大学 全国大学生统计建模大赛论文 基于粗糙集的个股指标两步择优分析 论文作者: 耿磊磊 高康 汪津津 指导教师: 杨贵军 二○○九年九月 全国大学生统计建模大赛论文 基于粗糙集的个股指标两步择优分析 ——基于粗糙集的个股指标两步择优分析 The Analysis of two-step selection of the best Stock Indicators Based on Rough Set ——The Analysis of two-step selection of the best Stock Indicators Based on Rough Set 基于粗糙集的个股指标两步择优分析 内容摘要: 现在的许多经济数据,金融数据都具有维度高、关系复杂和连续性等性质。对于这类数据指标的处理现在还没有很满意的方法,就这一事实,本文利用粗糙集理论辅以灰色关联系统的基本理论引入两步择优过程。首先利用传统的灰色关联度对数据指标进行初步择优,选择相关性比较大的指标。其次利用算法将连续的数据进行离散化,然后再利用粗糙集对此数据进行第二步择优。此外,本文将上述方法应用于股票价格变动的指标优选上,得出对股票价格变化率影响最为关键的指标。结论可以在一定程度上指导投资者的投资行为。 关键字:粗糙集; 灰色关联; ; 技术指标; 基本面指标 一、引言 粗糙集理论是80年初由波兰数学家Z.Pawlak首先提出的一个分析数据的数学理论。粗糙集理论作为一种具有极大潜力的知识获取工具,在80年代末吸引了世界各国数据挖掘领域研究者的关注。该理论是一种刻画不完整性和不确定性的数学方法,它能有效地分析和处理不精确、不一致、不完整的各种数据信息,并且从数据信息中发现隐含的知识,揭示数据潜在的规律。粗糙集理论是一门实用性很强的学科,已经在不少领域取得了丰硕的成果,如近似推理,数字逻辑分析和化简,建立预测模型,决策支持,控制算法获取,机器学习算法和模式识别等等。 由于我国现阶段股市运行和监管体制还不很完善,理论上的一些重要指标无力对价格做出合理的解释。晏艳阳、胡俊(2006)选取净资产收益率和每股收益指标代表上市公司的业绩,上海综合指数和深圳成份指数作为股票价格表征,运用时间序列分析方法,样本取值从1993年到2003年,研究发现:股票价格变动与上市公司业绩变化之间不存在长期均衡关系[1],说明股票价格不完全反应上市公司业绩,故而可以进一步考虑证券技术指标。 本文选取居中国500强首位的中石化数据,利用灰色关联和粗糙集对该股票价格相关的主要基本面指标和证券技术指标综合进行两部择优分析。值得关注的是结论中对价格变动有重要影响的都是证券技术指标,由此得出在选取的时间段内,证券技术指标对该股票价格的影响甚于基本面指标。该方法具有一定的适用性,可应用于任何个股的任意指标体系的分析。 二、粗糙集概述 基本的粗糙集理论认为知识就是人类和其他物种所固有的分类能力,分类是推理、学习与决策中的关键问题,因此粗糙集假定知识是一种对对象进行分类的能力。通常,数据是以关系数据库(二维表)的形式存储的。就象表格一样,每个表有许多条记录,每条记录有许多条属性 ,每一个属性表示待观察物体的某方面的性质。 信息系统被表示为,并且称为决策系统。此处是条件性集,是决策属性集。条件属性表示观察指标,而决策属性表示根据条属性所作出的判断指标。其中函数被称为信息函数,满足关系:,。其中是。 设是一信息系统,设, 。在中我们说根据属集,和是不可区分的,只要对于任意的属性及任意的记录满足。这样,对于每一个在上生成的二元关系,我们称之为不可区分关系,记为。 由于人们对世界认识的局限,因而对知识的获取也是有限的,这样得到的属性也是有限的,为合成等价关系而进行分类细化到某种程度时,就出现了不可辨别的关系,这样就形成了粗糙集理论中的“粒度”。知识的粒度性是造成使用已知知识不能精确表示某些概念的原因,这就是产生了关于不精确的“边界”思想。粗糙集中的模糊性就是一种基于边界的概念,即一个不精确的概念具有模糊地不可被明确划分的边界。所以为了刻画模糊性,我们引入上近似和下近似的精确概念。 设,,集合的下近似表示为*,其定义如下: *,即*是指利用属性集判断肯定属于的中元素组成的集合。 集合的上近似表示为*,其定义如下*,即*是那些利用属性集判断所有可能属于的中元素组成的集合。 集合的边界域表示为,其定义如下:,即是指那些利用属性集既不能判断肯定分到这个概念或者其补

文档评论(0)

sunshaoying + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档