2007美赛建模.doc

下载文档

11
0
约8.82千字
约 9页
2016-09-08 发布于天津
举报
版权申诉
保障服务

2007美赛建模.doc

1、本文档共9页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

2007美赛建模.doc

MCM2007A题：选区划分的优化摘要：利用数学方法，我们把各州划分为人数相等的选区，使得各区尽量紧凑和基础。例如方形，圆形等简单的的凸多边形。因此我们的方案是对纽约州的各个县的人口和地理坐标（经纬度）进行分析，将自然县划分为 N 个小的数据点，考虑县级边界和自然边界的可供选择的划分选区技术，主要采用K-means算法进行聚类分析，由于选取的K值的不同导致聚类结果不唯一，然后我们将这些聚类结果表示在地图上，考虑宗教，种族，政党，经济等人文主观因素，对各个聚类结果进行对比，从而找到最优的聚类结果。所以我们的模型不仅考虑到可以用数据衡量的客观变量的影响，同时考虑到一些无法用数据衡量的主观因素的影响，使我们的模型达到最优。问题重述公平，自从人类进入私有制的时代开始，公平变很难实现，各方的利益错综复杂，种族，党派，性别，经济等导致按照人数相当的选区也会被操作的不公平，如水螅蝾螈法的发明，这种方法产生了许多主观方面的弊端。我们首先定义简单而有公平，简单便是采取已知的行政单位边界为划分标准，将若干个临近的县联合起来即可。公平是人们具有一种抱团意识，将临近的县联合起来可以看作是一种大区域性的利益联合，有本区的利益群体选出可以代表这个大区域的众议员。 2.方法概述为了达到公平划分的目标，我们采用K-Mean聚类，在这里我们首先定义两个可数据化的量：各个县的人口数和该县的经纬地理位置，目的是根据这两个变量进行聚类使得到的结果符合，每个类别的人口数基本相等，每个类别在地理位置上距离相近。具体操作：设置第一个变量：将人口全部集中在各个县级中心，以县级中心（人口数）代表该区的位置，设置第二个变量：将各个县的经纬度分别表示其地理位置。最后我们把分类结果直观的表示在地图上，再依据宗教，种族，政党，经济等人文主观因素，对各个聚类结果进行对比，从而找到最优的聚类结果。 3. 建立的模型的定义 P（点）：各个县中心的坐标经纬度,随机标配1-62号。美国纽约州共有62个县，人口约为1938万人，将其划分为29个选区，也就是每个选区大约67万人左右。但是由于一些地方人口分布的极不均匀（如Hamilton County NY，5379人；Kings County NY，2465326人）,因此，纯粹以县级边界为边界的方法显然是不成立的，所以我们经过分析把人口大于67万人的区域分解，对县级下属的行政区域进行了二次划分。大致分为N个数据点。标为1-N号。中心点K，分为i类。 4.模型假设 ①在进行聚类时，忽略主观因素带来的影响。 ②各个县的人口值在一定时间内保持稳定（没有较大幅度的减少或增加）。 ③挪动少量人口在某些县中产生的影响可以忽略不计。 5.模型应用对这些数据点进行K-Means算法分析从数据点中，随机选取29个数据中心作为初始的聚类中心。 ①分别计算每一个点到k个中心点的距离（欧式距离）， ②如果当前计算的数据点离第i个（i=1,2,…,k）中心点最近，则把当前点归到第i类。 ③重新计算k个聚类中心点。计算方式如下，如果第i类有n个数据点，则第i类新的中心为： ④如果新的聚类中心跟上一次的聚类中心比较变化小于某值算法结束，否则转到第二步。由于多个点的复杂性，我们先选取3个K值点的说明为例，进行①-至③步骤。由于经过多次迭代，算法的结果会由于初始点的设置都达到一个具体稳定的值的表示，此时方案是收敛的，收敛于最佳的结果。不同的县坐标代表坐标轴上的不同的点，通过设置的初始点K个，通过计算欧氏距离使他们从位置上趋近于那些初始点。因此，确定初始点K是很重要的，不同的初始点K会导致不同的结果。我们以部分人口超过67万或者接近此值的县单位或者县下级单位为初始点20个（可将他们人认为是饱和点），生成一群围绕它的点形成聚类。将20个饱和点排除出去，形成独立的选区。然后对每一大类中不足67万人口的点进行“重量的赋值”，再此之前先引出一个思想方法：一个托盘内有各种不同质量的砝码，右侧托盘放入一个质量已经固定的重物，因此可能产生多种不同的砝码叠加方案。运用计算机可以模拟出各个不同的方案。每个县城的重量便是该县的人口总数，要求若干个县叠加后它们的“重量”是67万左右，因此可以得到每个大类中划分方案。重复此过程将剩余的9类分出。之后不同的点集合用不同的颜色标出，同县级边境图进行对比，进行边界的光滑处理，同时考虑到宗教，种族，经济，教育等主观因素，得出结果。 6.模型的优缺点该算法的缺点，初始点的设置需靠人为的设定，测算距离时需要计算大量的欧氏距离，并迭代，计算量较大。该算法的优点，模式简单，直接套用固定计算模式即可，划分后的选区，它们的县中心相互联系即可完成选票的统计。缩短了统计的时间。真正的能代表一个非常临近的大地区的人们的选举