- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
原创 数分析课程设计——主成分分析论文
** 大学数据分析课程设计论文题目:我国各省市自治区社会发展的综合状况指标分析学院:专业:姓名:学号:我国各省市自治区社会发展的综合状况指标分析摘要一个地区的全面发展必须使经济和社会协调发展。为了全面衡量社会发展水平,有必要选择一套能反映社会发展的有代表性的社会指标进行综合评价,对每个地区的社会发展水平进行测量分析,我们根据各地区统计指标,选择了有代表性的社会经济指标,包括城镇居民可支配收入、农村居民可支配收入、在校学生数、学校数、卫生机构数、固定资产投资总额等方面数据进行综合考察,利用主成分分析方法对各地区综合发展状况进行评价。论文中主要运用的方法是主成份分析法。主成份分析法的目的是利用降维的思想,把多指标转化为少数几个综合指标。分析出主成分后,对数据进行综合排名,能较直观的反应社会发展的综合状况,便于分析各省市自治区的社会发展情况和影响因素。关键词:各省自治区 社会发展综合状况指标 主成分分析 排名目录问题的提出…………………………………………………4基于主成份分析的社会发展综合状况指标的筛选2.1原理概述………………………………………………………… 4 2.1.1主成分分析的一般数学模型………………………… 4 2.1.2主成分分析确定的一般原则………………………… 5 2.1.3主成分分析的基本步骤……………………………… 52.1.4主成分分析得到的主成分与原始变量之间的关系… 52.2原始数据及来源………………………………………………… 62.3 对指标的主成分分析及筛选………………………………… 72.3.1操作过程……………………………………………… 72.3.2 实验结果输出……………………………………… 8 2.3.3 实验结果分析……………………………………… 12总结………………………………………………………… 14参考文献……………………………………………………………16 附录………………………………………………………………… 16第一章问题的提出中国的经济和社会的发展如何让才能踏上一条内外和谐、全面增长的稳健之路,不但攸关中国自身的利益,也成为举世瞩目的焦点。本文根据各省的社会发展指标,将全国主要省份社会实力进行排名,从而可以为政府决策部门对社会的发展规划提供一定的依据。日后通过政府政策的调整,各省再发挥各自优势力量,抓住机遇,社会全发张和可持续发展能力一定会进一步提高。社会发展状况评价的难点在于反映社会发展的指标众多,每一项指标又会从不同视角反映社会发展状况。所以,依据他们作综合评价有一定难度。我们可以看到,成份分析法的目的是利用降维的思想,把多指标转化为少数几个综合指标,从而很好地解决了这一问题。第二章基于主成份分析的社会发展综合状况指标的筛选2.1原理概述主成分分析是考察多个定量(数值)变量间相关性的一种多元统计方法。它是研究如何通过少数几个主分量(即原始变量线性组合)来解释多变量的方差——协方差结构。具体地说,是导出少数几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间不相关。主成分分析常被庸吏寻找判断某种事物或现象的综合指标,并给综合指标所蕴藏的信息以恰当解释,以便更深刻地解释事物内在的规律。2.1.1主成分分析的一般数学模型假设有n个样本,每个样本测得p项指标(pn)。由于这p项指标之间往往具有相关关系,且每个样本各指标取值的单位和数量大小不同,使我们较难利用这p项指标的信息区别这n个样本。因此,如何从这p项指标中找出少数几个综合指标,使它们尽可能多地反应各项指标的信息,而且彼此之间不相关,这就成为一个重要的问题。怎么解决这个问题,主成分分析给出了最好的方法。如果记原来的变量指标为,它们的综合指标——新变量指标为,(m≤p)。则在(2)式中,系数lij由下列原则来决定:(1)zi与zj(i≠j;i,j=1,2,…,m)相互无关;(2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差最大者;……;zm是与z1,z2,……zm-1都不相关的x1,x2,…,xp的所有线性组合中方差最大者。这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一,第二,…,第m主成分。其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。从以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),从数学上容易知道,它们分别是x1,x2,…,xp的相关
您可能关注的文档
- 医学统计点总结.docx
- 医学科技代化与道德建设.doc
- 医学影像医疗质量管理与持续改进材料目录.doc
- 医学英语教材下册unit5翻译.doc
- 医学英语根词缀大全.doc
- 医学资料医学专业文献,医学信息的收集,医学文档的整理.doc
- 医师定期核工作制度及实施方案.doc
- 医学遗传教学大纲.doc
- 医学院第届大学生职业规划大赛方案书新.doc
- 医学职业涯规划范文.doc
- 新视野二版听说1第6单元示范1课件.ppt
- 【参考答案】 联络口译(第二版) 《联络口译》(第二版)参考答案.pdf
- 梅大高速茶阳路段“5·1”塌方灾害调查评估报告.docx
- 虹吸雨水PE管施工节点标准做法.pdf
- 2025消防设施施工质量常见通病防治手册,典型图示+规范要求.pptx
- 新视野大学英语(第二版)读写教程 4 空军工程大学编U05B.ppt
- E英语教程2(智慧版)Unit 6.pptx
- E英语教程3(智慧版)Unit 7.ppt
- 新视野二版读写1第4单元课件Section A How to Make a Good Impression.pptx
- E英语视听说教程4(智慧版)4-U2课件(2024版)U2.pptx
文档评论(0)