数据挖掘论文(聚类分析及其应用).docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘论文(聚类分析及其应用)

聚类分析及其应用 姓名:周建刚 学号:2009018397 班级:信息091 内容摘要: 本文主要阐述了聚类方法及在金融投资、股市、证券投资等方面的一些应用。运用聚类分析模型帮助投资者正确的理解和把握金融投资、股票、证券投资的总体特征,确定投资范围,并通过类的总体价格水来预测金融投资、股票价格、证券投资的变动趋势,选择有利的投资时机。 关键字: 聚类分析 金融投资 聚类方法 股市投资 证券投资 应用 正文: 聚类分析将物理或抽象对象的集合分成为由类似的对象组成的多个类的过程称为聚类。聚类分析WEB个性化应用的一种重要技术手段。作为一种无示例学习,,(类或群),,,,:;A{a1,a2,,am}B{b1,b2,,bn}B的最后一个关键词类bn(即用户目前感兴趣的资源类),bn资源类中最相似的资源类ai。我们用余弦相似度计算bn和ai最相似的类找到maxsim(bn,ai) 权威用户中越是相似类的近邻后继知识推荐的可能性越大, 因此推荐列表中增加一个后继知识度分量。若资源j 属于关键词集合k, 推荐值排名在前N 位的, 成为用户的最终推荐列表,推荐给用户。 聚类方法目前各类文献中提出了众多聚类算法可供选择,主要的有划分方法、层次方法、基于密度的方法、基于网格的方法及基于模型的方法等。划分方法是给定要构建的划分的数目K,首先创建一个初始划分,然后采用一种迭代的重定位技术,尝试通过对象在划分间移动来改进划分。一个好的划分的准则是:在同一类中的对象之间尽可能接近或相关,而不同类中的对象之间尽可能远离或不同。为了达到全局最优,基于划分的聚类穷举了所有可能的划分;层次方法层次的方法是对给定的数据对象集合进行层次的分解。层次方法有两种分解形式:凝聚和分裂。凝聚方法也称为自底向上的方法,初始将每个对象作为单独的一个组,然后相继地合并相近对象或组,直到所有的组合并为一个层次的最顶层),或者达到一个中止条件。分裂方法也称为自顶向下法,初始将所有的对象置于一个组中,在迭代的过程中,一个组被分裂为更小的组,直到最终每个对象在单独的一个组中,或者达到一个中止条件。 我们再举个例子。设有n 个样品,p 个指标,每个样品都有这p 个指标的观察值,设第 I 个样品的第j个指标的观察值为xij,把n个样品看成P维空间中的n个点,则两个样品间亲疏程度可用P维空间中两点的距离来度量。令dij表示样品xi与xj的距离。定义距离公式,本文采用明氏距离。 明氏(Minkowski)距离:dij(q)= 当q=1时,明氏距离变为绝对距离: dij(1)= 当q=2时,明氏距离变为欧式距离: dij(2)= 当q=,明氏距离变为切比雪夫距离: dij()= 系统聚类除了要定义事物之间的亲疏程度指标,还要定义类与类之间亲疏程度指标并且要导出求取类间亲疏指标值的递推公式。系统聚类初始,先把所有待分类事物各自看成独立的一类,求出两两之间的亲疏指标值,把关系最为亲密的两类合并成一个新类,然后计算新类与原有各类之间的亲疏指标值,再把其中关系最为密切的两类合并??如此反复进行,直到最终所有待分类事物合并成一个大类为止。最终绘成一幅系统聚类的谱系图,再根据一定的原则确定最终分类结果。 当要分析的数据缺乏描述信息,,,,参考文献: []陈共,,.证券投资分析[M].北京:,1997.[2]杨震,,,.信息服务个性化过程中的模式识别[J].东南大学学报,2002,4(10):67-70.[3]郭家义.数字图书馆个性化定制服务相关问题研究[J].图书情报工作,2003,(4):9-11. [4].基于语义的个性化web搜索[J].情报杂志,2003,(3). [5],,.个性化数字服务模型[J].微电子学与计算机,2001,(1):14-18. [6].个性化推荐系统关键技术研究[D].人民大学博士论文,2003.11. [7].基于WEB挖掘的个性化研究[D].南京大学博士论文,2004.[8]邓秀勤.聚类分析在股票市场板块分析中的应用[J].数理统计与管理,1999,18(5):1-4.

文档评论(0)

asd522513656 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档