- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于主成分分析和聚类分析的我国各省市经济效益研究 姓名: 学号: 学院: 班级:2008.03 指导教师: 前言 本文对主成分分析和聚类分析的基本理论知识进行了阐述,然后利用主成分分析法对描述我国工业企业的原始经济指标进行降维,求得几个综合指标,借助这几个综合指标对各企业经济效益进行评价研究,最后根据综合指标建立一个最终的评价指标,借助该指标对全国28个主要省、市、自治区的独立核算工业企业的经济效益做出排名,最后借助聚类分析对之进行了分类。 主成分分析 原理及思想: 主成分分析就是将众多具有一定相关性的指标(p个指标),重新组合成一组相互无关的几个综合指标来代替原来的指标。通常数学上的处理就是将原来的指标做线性组合,作为新的综合指标。 主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。 主成分分析 主成分分析的基本理论 设对某一事物的研究涉及个p指标,分别用表示,这个p指标构成的p维随机向量为。设随机向量X的均值为,协方差矩阵为。对X进行线性变换,可以形成新的综合变量,用Y表示,也就是说,新的综合变量可以由原来的变量线性表示,即满足下式: 主成分分析 主成分分析 基于以上三条原则决定的综合变量 分别称为原始变量的第一、第二、…、第p个主成分。其中各综合变量在总方差中占的比重依次递减,在实际研究工作中,通常只挑选前几个方差最大的主成分,从而达到简化系统结构,抓住问题实质的目的。 聚类分析 原理及思想: 聚类分析将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。样品或指标(变量)之间存在着程度不同的相似性(亲疏关系),根据一批样品的多个观测指标,找出一些能够度量样品或指标之间的相似程度的量,以这些量为划分类型的依据,把相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另外一类,…。 聚类分析 关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品(或指标)都聚合完毕,形成一个由小到大的分类系统。最后再把整个分类系统画成一张分群图(又称谱系图),用它把所有的样品(或指标)间的亲疏关系表示出来。聚类分析可以用来对案例进行分类,也可以用来对变量进行分类。聚类分析有多种方法,下面主要介绍聚类分析中最常用的系统聚类法。 聚类分析 系统聚类法的几种常用方法: 最短距离法就是类与类间距离采用最短距离法的系统聚类方法。 最长距离法是类与类间距离采用最长距离法的系统聚类法。 重心法是类与类之间的距离就用重心之间的距离来代表的系统聚类方法。 类平均法有两种形式,一种是组间联结法,另一种是组内联结法。类平均法是聚类效果较好、应用比较广泛的一种聚类方法。本文最后的聚类分析就是以类平均法进行的。 实例分析 实例简述: 在企业经济效益的评价中,设计的指标往往很多。这里涉及9项原始指标,包括百元固定资产实现值等。为了简化系统结构,抓住经济效益评价中的主要问题,我们由原始数据矩阵出发求主成分。选取我国28个省、市、自治区独立核算的工业企业,对其经济效益进行评价,原始数据见下表 实例求解 由主成分系数表得到两个主成分的表达式为: Y1=0.375555x1+0.393392x2+0.375252x3+0.093533x4+0.174557x5+0.372146x6 +0.361613x7+0.351313x8+0.362591x9 Y2=-0.2595x2+0.13437x2+0.265284x3+ 0.711303x4+0.491309x5-0.16495x5-0.22539x6 -0.05236x7-0.05236x8-0.12675x9 综合得分表 系统聚类冰柱图 聚类分析聚成几类是聚类分析中迄今为止尚未完全解决的问题之一,主要的障碍是对类的结构和内容很难给出一个统一的定义,这样就给不出从理论上和实践中都可行的虚无假设。实际应用中人们主要根据研究的目的,从实用的角度出发,选择合适的分类数。系统聚类中每次合并的类与类之间的距离(也叫聚合系数)可以作为确定类数的一个辅助工具。首先把离得近的类合并,在并类过程中聚合系数呈增加趋势,聚合系数小,表示合并的两类的相似程度较大,两个差异很大的类合到一起,会使该系数很大。如果以y轴为聚合系数,x轴表示分类数,画出聚合系数随分类数的变化曲线,可以在曲线开始变得平缓的
您可能关注的文档
最近下载
- 海口市美兰区健身俱乐部会员健身现状的调查与研究.doc VIP
- 第2讲《办好中国的事情关键在党》(课件)《学生读本(小学高年级)》.pptx VIP
- 第1讲《伟大事业都始于梦想》(课件)《学生读本(小学高年级)》.ppt VIP
- 2017初中生物会考最全知识点复习资料(必过).doc VIP
- 儿童呼吸系统疾病雾化治疗合理应用专家共识.pptx VIP
- 铝厂熔铸车间安全常识.pptx VIP
- 《中华人民共和国国家安全法》培训与解读课件.pptx VIP
- 第六章 学习法治思想提升法治素养练习题及答案.docx VIP
- 五年级上册小学高年级学生读本第2讲《办好中国的事情关键在党》教案.doc VIP
- 《公共安全教育》课件.ppt VIP
文档评论(0)