聚类在股票研究中地应用.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类在股票研究中的应用 张迎春张燕平赵姝陈洁张晨曦 安徽大学人工智能研究所230039 .zhangyin98219@163·corn 摘要本文介绍了聚类分析方法在股票研究中的应用.并且蛤出了聚类分析的算法.使用这种方 洼.可以通过分析历史数据,对股票的发展趋势进行预测. 关键词聚类.股票,趋势 1.引言 大家都知道“物以类聚,人以群分”这句古话的含义,可见人们很早就发现把事物进行分类 研究的好处.当人们面对错综复杂的数据时总觉得处理起来比较麻烦,然而进行分类以后事情往 往变得比较简洁明了.聚类起源于分类学,也是人类最基本的认识活动之一。金融和经济一直是 广丈人群十分关心的话题,最近聚类分析在这方面也有着广泛的利用.对于聚类的算法有许多种 而且各有千秋.本文主要介绍一种聚类方法在股票研究中的应用。根据现有的数据结果进行聚类. 然后对结果中的比较有特点的进行分析. 2.聚类的介绍 在这里我们详细介绍一下聚类.所谓的类就是指具有某些相似元素的集合。所谓的聚类就是 按照事物的某些属性,把事物聚集成类,使类阍的相似性尽量小,类内相似性尽量大。聚类(cluster) 就是把一个Ⅳ维的欧氏失时空间划分为Ⅳ个区域,这区域分别由其中心矢量表示.这个过程需 要一个有大量的矢量构成的样本集,通过统计试验后得出肘个中心矢盈。这一过程叫做训练也就 是我们所说的聚类过程.这M个中心矢量通常称为一个大小为M的码本。每个中心矢量都成为 一个码字.聚类分析的内容非常丰富.常用的聚类方法有系统聚类法、传递必包法、动态聚类法、 C-均值聚类法等.聚类有一个重要的问题就是如何确定一个准则。使褥在这个准则下聚类过程达 到最优,也就是用这Ⅳ个中心矢量可以最好的表是这个样本集.设有样本集。驴{J-},1≤f≤Ⅳ’我们 要把它聚成肘类。 u n X=cI c2u…c_(qc,=巾.当icy) 这个分类记作为C,而起准则度量(距离)记作D(c).聚类的任务就是对z作一个最准分类 uc2u…CI使得D(c)=minD(C)· X=q 一个理想的准则度量必须在主观上是有意义的而且易于运算。这种度量有好多种,常用的几 种有: Di(c)一trrw) ‘D2(c)ltr(w’1口) D3(c);tr(r‘占) D4(C)=det矽 其中Dl最常用,称为最小平方距离准则。 第14届中国神经网络学术会议论文集 聚类的算法很多.比较常见多用的是LBG算法,这种算法是比较经典的算法j对于聚类效果 还是比较好的。而且它的算法复杂度不高,往往可以得到局部最佳的结果。但是它也有一些不足 之处,例如它的结果过多依赖于初始向量是否分散从而使得出的结果不具有代表性。 本文引用 的是一种改进LBG算法,它具有更高的效率。 下面介绍一下此算法一些步骤: 程中射个区域,cj(t+1)是区域RAt)的质心(19≤m)。 (4)计算区域尺f(,)的失真Di(,) time=time+1,令新码书: (5)如果Df(f)=0或(D,一.1).D.(r))JD.(,)如.则弘卜毋(m c,+l;{o,(,+1)119!m),r-,+l,如果time=m,则转(6)。 有的新码字集和便是最终的码书。 3.结果的分析 我们具有众多上市公司近几年的财务报表,由于报表的数据比较庞大直接进行分析是非常困 难和复杂的。然而.进行聚类分析后数据就简洁多了,这就有利于我们做出快速而且准确的分析· 首先,我们统计出我们所需要的有关公司的信息。它包括:每股收益(我们把它作为主要属性)、 每股净资产、

文档评论(0)

cxmckate + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档