聚類分析美国人口分类.docxVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚類分析美国人口分类

2013数学建模课程设计论文学院 数学与信息科学学院专业 数学与应用数学 姓名 杨培亮学号 201115414美国人口问题研究报告摘要 人口资源是最具战略性的资源,人口管理现代化,对于每个国家各项事业的发展至关重要。要把握美国的人口问题,必须掌握人口分布状况。材料3分别出了2010年美国老年人口在各地区和各年龄段的分布情况。材料4分别给出了2010年美国各个州常住人口在各年龄段的分布情况。通过对各个州或地区的人口占总人口的比例、老年比例、少儿人口比例等数据进行聚类分析,选择了相应指标对美国各州的人口发展水平进行了综合评价。进而对美国不同地区人口发展的现状水平及各自特点制定相应的方案。关键字 人口分布 聚类分析 综合评价 1问题的重述人口资源是最具战略性的资源,人口管理现代化,对于每个国家各项事业的发展至关重要。一个人从出生到婴幼儿、青少年、中年、老年直至死亡是一个生命过程,它是不可逆转的单向过程。一个国家的人口可以因为老年人口增加快于青少年人口,使得人口结构从较年轻的状态变化到较年老的状态,形成人口老龄化;而由于青少年人口增加快于老年人口,则会形成人口年轻化。而人口问题是全世界都日益关注的问题。本文以美国区域人口发展状况为例,对美国的人口发展水平做出综合评价,以期能对人口的发展现状有大概了解,并对后续研究起到抛砖引玉的作用。2问题的分析在数据挖掘领域中,聚类分析是一项重要的研究工具,把聚类分析应用到人口的研究中 ,对人口的管理和控制有很大的作用。目前,人们提出了很多种聚类算法。对于材料3中老年人分别在各个年龄段和各个种族的分布数据,材料4美国各个州常住人口在各年龄段的分布的数据,非常符合k-means算法的优点和条件,采用k-means算法能达到很好的效果。3 模型假设假设材料中数据来源真实可靠。不考虑计算机计算精度计算所引起的误差。4 符号说明 _______________________ _符号______________含义____ T 每一组数据的类别H 每种类别包含的组数 cid 每一组数据的类别_nr___________每种数据包含的组数 5 模型的建立与求解5.1 数据预处理 通过分析材料3材料4所给的PDF文件,将其中的表格转换成EXCEL形式(见附录)。5.2 材料3 材料3中给出了2010年美国老年人口在各地区和各年龄段的分布情况,我们可以分两部分建模。5.2.1模型一美国的四个地区(Northeast、Midwest、South、West)的数据量较少,可以采用层次聚类的方法。一次聚类:A=xlsread(1.xlsx,B4:E7);T=clusterdata(A,2);得到T的值分别为2 2 2 1分步聚类:Step1:寻找变量之间的相似性 A1=zscore(A); A2=pdist(A1);Step2:定义变量之间的连接A3=linkage(A2);Step3:评价聚类信息 A4=cophenet(A3,A2);Step4:创建聚类,并做出谱系图 T=cluster(A3,2); H=dendrogram(A3);5.2.2 模型二美国的52个州或地区,数据量较大,采用k-means算法建模比好(k-means源代码见附录)。当聚合成3类结果为(源代码见附录):cid =Columns 1 through 521 2 1 1 2 2 1 1 2 3 2 3 2 1 1 3 1 1 2 3 2 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 3 11 1 1 2 2 1 2 3 1 1 2 3nr = 33 13 6分类效果图为:当聚合成4类结果为(源代码见附录):cid =Columns 1 through 523 4 3 3 1 1 2 3 1 2 4 2 1 1 3 2 3 3 1 2 1 3 3 1 3 3 2 3 1 3 3 3 3 3 2 3 3 3 2 2

文档评论(0)

fv45ffsjjI + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档