聚类规则在金融行业的应用分析剖析.docxVIP

聚类规则在金融行业的应用分析剖析.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类规则在金融行业的应用分析剖析

聚类规则在金融行业的应用分析 摘要:俗话说“物以类聚,人以群分”。对事物进行分类,是人们认识事物的出发点,也是人们认识世界的一种重要方法。在自然科学和社会科学中,存在着大量的聚类问题。通俗地说,类是指相似对象的集合。聚类分析是数据挖掘中的一种重要方法。既可以作为独立的方法透视数据分布,也可以作为其他分析方法的预处理步骤。然而,聚类与分类的不同在于,聚类所要求划分的类是未知的。基于聚类规则的特点,它被广泛应用在银行、零售和保险领域等其他各个领域,例如,应用于股票市场的研究、营销策略中的客户细分等。 关键词:数据挖掘;聚类规则;金融;股票市场;板块 前言: 俗话说“物以类聚,人以群分”。对事物进行分类,是人们认识事物的出发点,也是人们认识世界的一种重要方法。在自然科学和社会科学中,存在着大量的聚类问题。通俗地说,类是指相似对象的集合。聚类分析是数据挖掘中的一种重要方法。聚类与分类的不同在于,聚类所要求划分的类是未知的。基于聚类规则的特点,它被广泛应用在银行、零售和保险领域等其他各个领域,例如,应用于股票市场的研究、营销策略中的客户细分等。 正文: 聚类规则在金融行业的应用分析 近年来,计算机应用范围日益扩大,数据库技术和挖掘技术的不断发展,因此利用信息技术生产和搜集数据的能力大幅度提高,人类所拥有的数据急剧增长,各种大型数据库被广泛应用于各行各业,而且这一势头将继续发展下去。一般来说,数据挖掘是指从数据库或数据仓库中发现隐藏的、预先未知的、有趣的信息的过程,该过程可以看作是知识发现过程中的一个核心步骤。而聚类规则挖掘是数据挖掘中最活跃的研究方法之一。本文就数据挖掘中的聚类规则及其在金融行业的具体应用进行详尽的分析与说明。 一、聚类 聚类是把对象或样本的集合分组成为多个簇的过程,使同一个组中的对象具有较高的相似度,而不同类的对象差别较大。相异度是根据描述对象的属性值进行计算的,距离通常采用相异度度量方式。在许多应用场合,可以把一个簇中的对象作为一个整体对待。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。 二、聚类规则的概念 聚类规则就是通过对样本或指标进行量化分类,讨论的对象是大量的样品,要求能按各自的特性进行合理的分类。其目标就是在相似的基础上收集数据来分类。聚类规则是一种重要的人类行为。早在孩提时代,一个人就通过不断地改进下意识中的聚类模式来学会如何区分猫和狗,或者动物和植物。 三、聚类规则的分析 聚类规则是一个富有挑战性的研究领域,它的潜在应用提出了各自特殊的要求。数据挖掘对聚类的典型要求如下:可伸缩性、处理不同类型属性的能力、发现任意形状的聚类、用于决定输入参数的领域知识最小化、处理噪声数据的能力、对于输入记录的顺序不敏感、高维性、基于约束的聚类、可解释性和可用性。 建立模型:设有n个样品,p个指标,每个样品都有这p个指标的观察值,设第i个样品的第j个指标的观察值为xij,把n个样品看成p维空间中的n个点,则两个样品间亲疏程度可用p维空间中两点的距离来度量。令dij表示样品xi与xj的距离。定义距离公式——明考斯基距离,即:dij(q)=[∑|xik-xjk|q]1/q 当q=1时,明考斯基距离变为曼哈顿距离:dij(1)=∑|xik-xjk| 当q=2时,明考斯基距离变为欧几里得距离:dij(2)=[∑|xik-xjk|2]1/2 聚类分析的职能是建立一种分类方法,它是将一批样品或变量,按照他们在性质上的亲疏程度进行分类叫。凡是具有数值特征的变量和样品都可以采用系统聚类方法,选择不同的距离和聚类方法可以获得满意的数值分类效果。聚类分析 法是把个体逐个地合并成一些子集,直至整个总体都在一个集合之内为止。其分类步骤如下: (1) 聚类前先对数据进行变换处理。 (2) 聚类分析处理的开始是各样品自成一类(n个样品一共有n类),计算各样品之间的距离,并将距离最近的两个样品并成一类。 (3) 选择并计算类与类之间的距离,并将距离最近的两类合并,如果类的个数大于1,则继续并类,直至所有样品归为一类为止。 (4) 最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。 四、聚类规则在股票中的应用分析 随着我国市场经济建设的高速发展, 人们的金融意识和投资意识日益增强, 而作为市场经济的组成部分—股票市场, 正逐步走向成熟与规范, 越来越多的投资者把眼光投向了股票, 历史已经证明股票是一种不仅在过去已提供了投资者可观的长期利益, 并且在将来也将提供良好机遇的投资媒体。然而, 股价涨跌无常, 股市变幻莫测, 投资者要想在股市投资中赢取丰厚的投资回报, 成

文档评论(0)

jiayou10 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档