2007美赛建模.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2007美赛建模.doc

MCM2007A题:选区划分的优化 摘要: 利用数学方法,我们把各州划分为人数相等的选区,使得各区尽量紧凑和基础。例如方形,圆形等简单的的凸多边形。因此我们的方案是对纽约州的各个县的人口和地理坐标(经纬度)进行分析,将自然县划分为 N 个小的数据点,考虑县级边界和自然边界的可供选择的划分选区技术,主要采用K-means算法进行聚类分析,由于选取的K值的不同导致聚类结果不唯一,然后我们将这些聚类结果表示在地图上,考虑宗教,种族,政党,经济等人文主观因素,对各个聚类结果进行对比,从而找到最优的聚类结果。 所以我们的模型不仅考虑到可以用数据衡量的客观变量的影响,同时考虑到一些无法用数据衡量的主观因素的影响,使我们的模型达到最优。 问题重述 公平,自从人类进入私有制的时代开始,公平变很难实现,各方的利益错综复杂,种族,党派,性别,经济等导致按照人数相当的选区也会被操作的不公平,如水螅蝾螈法的发明,这种方法产生了许多主观方面的弊端。 我们首先定义简单而有公平,简单便是采取已知的行政单位边界为划分标准,将若干个临近的县联合起来即可。公平是人们具有一种抱团意识,将临近的县联合起来可以看作是一种大区域性的利益联合,有本区的利益群体选出可以代表这个大区域的众议员。 2.方法概述 为了达到公平划分的目标,我们采用K-Mean聚类,在这里我们首先定义两个可数据化的量:各个县的人口数和该县的经纬地理位置,目的是根据这两个变量进行聚类使得到的结果符合,每个类别的人口数基本相等,每个类别在地理位置上距离相近。具体操作:设置第一个变量:将人口全部集中在各个县级中心,以县级中心(人口数)代表该区的位置,设置第二个变量:将各个县的经纬度分别表示其地理位置。最后我们把分类结果直观的表示在地图上,再依据宗教,种族,政党,经济等人文主观因素,对各个聚类结果进行对比,从而找到最优的聚类结果。 3. 建立的模型的定义 P(点):各个县中心的坐标经纬度,随机标配1-62号。 美国纽约州共有62个县,人口约为1938万人,将其划分为29个选区,也就是每个选区大约67万人左右。但是由于一些地方人口分布的极不均匀(如Hamilton County NY,5379人;Kings County NY,2465326人),因此,纯粹以县级边界为边界的方法显然是不成立的,所以我们经过分析把人口大于67万人的区域分解,对县级下属的行政区域进行了二次划分。 大致分为N个数据点。标为1-N号。中心点K,分为i类。 4.模型假设 ①在进行聚类时,忽略主观因素带来的影响。 ②各个县的人口值在一定时间内保持稳定(没有较大幅度的减少或增加)。 ③挪动少量人口在某些县中产生的影响可以忽略不计。 5.模型应用 对这些数据点进行K-Means算法分析 从数据点中,随机选取29个数据中心作为初始的聚类中心。 ①分别计算每一个点到k个中心点的距离(欧式距离), ②如果当前计算的数据点离第i个(i=1,2,…,k)中心点最近,则把当前点归到第i类。 ③重新计算k个聚类中心点。 计算方式如下,如果第i类有n个数据点,则第i类新的中心为: ④如果新的聚类中心跟上一次的聚类中心比较变化小于某值算法结束,否则转到第二步。 由于多个点的复杂性,我们先选取3个K值点的说明为例,进行①-至③步骤。 由于经过多次迭代,算法的结果会由于初始点的设置都达到一个具体稳定的值的表示,此时方案是收敛的,收敛于最佳的结果。 不同的县坐标代表坐标轴上的不同的点,通过设置的初始点K个,通过计算欧氏距离使他们从位置上趋近于那些初始点。 因此,确定初始点K是很重要的,不同的初始点K会导致不同的结果。我们以部分人口超过67万或者接近此值的县单位或者县下级单位为初始点20个(可将他们人认为是饱和点),生成一群围绕它的点形成聚类。将20个饱和点排除出去,形成独立的选区。然后对每一大类中不足67万人口的点进行“重量的赋值”,再此之前先引出一个思想方法:一个托盘内有各种不同质量的砝码,右侧托盘放入一个质量已经固定的重物,因此可能产生多种不同的砝码叠加方案。运用计算机可以模拟出各个不同的方案。 每个县城的重量便是该县的人口总数,要求若干个县叠加后它们的“重量”是67万左右,因此可以得到每个大类中划分方案。重复此过程将剩余的9类分出。之后不同的点集合用不同的颜色标出,同县级边境图进行对比,进行边界的光滑处理,同时考虑到宗教,种族,经济,教育等主观因素,得出结果。 6.模型的优缺点 该算法的缺点,初始点的设置需靠人为的设定,测算距离时需要计算大量的欧氏距离,并迭代,计算量较大。 该算法的优点,模式简单,直接套用固定计算模式即可,划分后的选区,它们的县中心相互联系即可完成选票的统计。缩短了统计的时间。真正的能代表一个非常临近的大地区的人们的选举

文档评论(0)

tangtianxu1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档