一般区间及分布式符号数据的PCA研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要 传统的主成分分析主要针对点数据,面对信息社会知识爆炸、信息量倍增的 现象,传统的分析方法在处理海量数据,从整体上把握数据属性方面有所欠缺, 符号数据分析方法通过“数据打包”,实现了从整体上把握海量数据内部之间的 关系。本文主要研究一般分布的区间型符号数据和分布式符号数据的主成分分析 和因子分析。 . 在现有的针对均匀分布区间数据作主成分分析(PCA)的研究成果基础上, 本文从区间变量的经验密度函数入手,逐步推导了区间变量的均值、方差、协方 差、相关系数等描述性统计量,继而研究了区间数据的标准化问题。在此基础上, 进行了主成分分析和因子分析的方法研究。依次以中国股市不同类股票和不同市 值范围股票为符号对象,以市场表现和财务报表相关指标为变量,进行了案例分 析。 对分布式符号数据的主成分分析和因子分析进行.了一些探索研究,包括分布 式符号数据的形成,分布式符号数据的标准化,分布式数据的主成分分析和因子 分析等等。以中国股市不同类股票为符号对象,以市场表现和财务报表相关指标 为变量,形成分布式符号数据,进行了案例分析。 研究结论表明,与以往文献假设样本点在区间内服从均匀分布相比,一般分 布的区间型符号数据PCA方法更具有实际意义,而分布式符号数据的PCA方法 则是对符号数据分析方法体系的进一步完善。 关键词: 主成分分析一般分布区间数分布式符号数据 ABSTRACT Thetraditional aimsat withthe data. principalcomponentanalysis dealing point 删leinthefaceofthe of andthe of the explosionknowledgephenomenondoubling amountof methodsis in with traditional information,theanalysis inadequatedealing ofdataand the ofthe data amounts wholeattributes huge grasping data.Symbolic makes the ofthemassdatatruefromthewhole analysis realizingrelationship the”data this andfactor through package”.Inpaper,theprincipalcomponentanalysis ofthe distributedinterval dataand analysis generally symbolic histogram·valued dataisstudied. symbolic Onthebase the the distributed of researchresultsabout existing uniformly interval article studiedthe principalcomponentanalysis(PCA),thisgradually as

文档评论(0)

zz921 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档