- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GIS在人口统计分析中的应用
1200013223 城市与环境学院 付博
人口信息与地理信息的关系
人口信息是一种典型的统计信息,除了本身的自然属性和社会经济、文化特征外,还具有明显的空间特征。其空间特征体现在人口在不同地理单元的分布,人口流动的规模、方向和路线及在不同时间人口的分布变化等。
将人口信息与地理信息相结合,不仅能进一步提高人口信息管理的水平,而且能开拓人口信息数据挖掘的新途径,更好地为研究人口规律,为制定人口政策的制定提供帮助。因此,发达国家和发展中国家都相继研究和建设与人口普查、户籍管理制度相适应的人口地理信息系统,其中以美国起步最早。美国早在1970年的人口普查时,采用自动化技术,发展了一套名为GBF/DIME的系统,这套系统成为了后来人口地理信息系统的雏形。
我国人口地理信息系统的发展
而我国人口地理信息系统的建立始于1982年。1982年我国第三次人口普查后,科学院地理研究所使用ARC/INOF软件输入了我国29个省的地图及普查数据,并首次出版了我国29个省、直辖市、自治区普查数据的人口地图集。
在第五次人口普查时,国务院提出“有条件、有能力的省市地区可率先建设人口地理信息系统”。而在2010年的第六次人口普查时,北京市开发的基于SuperMap GIS平台的“北京市第六次全国人口普查地理信息系统”顺利通过初步验收。可见,我国的人口地理信息系统正在飞速发展。
常规统计分析方法与空间统计分析方法的差异
我们说的人口数据是指一套基于人口的统计信息,包括但不限于性别情况、受教育情况、工作情况等。因此,人口数据本质上是可以看做多维的随机向量。本段落标题中提到的两种统计分析方法是指常规统计分析与空间统计分析。
在不考虑空间地理位置的情况下,对人口数据采用常规的统计方法依然是很有效的。对各个地区计算其人口的均值、标准差、直方图,就可以描述人口信息的情况。对人口信息进行时间序列分析,就可以获得人口的周期性变化和趋势变化。对人口信息与社会经济、环境质量等其他变量做相关分析、回归分析,讨论它们的共变和因果关系。甚至,我们可以单纯基于人口数据对区域进行聚类分析,将人口性质相似的区域划分在一个组里。当然,这样聚类分析得到的分组只是随机变量间的距离小,可能同组内的两个区域在地里位置上距离很大。
而当我们对人口信息进行空间统计分析时,我们相当于给每个数据点赋予了邻域的值,利用了更多的信息方法更加有效。同时,通过地图可以让我们更容易地进行数据挖掘,发现数据背后隐藏的规律。比如通过叠加地形图,我们可以发现高大的山脉两侧的居民的受教育程度有明显差异。再比如叠加流域图,我们可以发现流域中下游冲积平原的人口密度通常非常大。
而在我们实际对人口信息进行统计分析时,常规统计方法和空间统计分析方法应当并用,针对不同的问题采取恰当的方法,从统计数据中获得更多更准确的信息。
人口统计数据空间化方法
建立人口地理信息系统的第一步就是把人口统计数据空间化,即把人口统计数据资料与空间特性联系起来,进而才能通过空间分析方法研究人口分布。
人口统计数据与空间特性的连接,根据研究问题的需要可以分成全局方案和局部方案。全局方案是把该地区看成一个均质的区域,这样人口统计数据就表示成该地区的平均值。局部方案是认为人口在每个区域内是变化的,需要我们把区域内的差异模拟出来。前者可以采用矢量模型来实现,而后者宜采用栅格模型实现。
全局方案的实现较容易,这里就不赘述了。局部方案的模型建立主要有两种思路:其一是构建数学模型模拟人口分布情况;其二是利用控制点的值插值计算人口密度场。从本质上来说,前者是机理模型,需要考虑土地利用、交通情况、经济状况等等可能影响人口分布的因素构建预测模型。对不同地区模型采用的预测变量和系数可能差异很大,但具有相对明确的现实意义。而后者是统计模型,根据已知点的人口密度进行插值计算,其背后的假设是研究区域内的人口密度不会随空间发生突变(不考虑奇点比如峭壁两侧),插值计算得到的结果通常是令人满意的,但决定人口分布情况的影响因素在本模型中不明确。
几种典型的空间统计分析方法在人口信息处理中的应用
空间自相关分析
方法介绍
空间自相关分析是认识空间分布特征、选择适宜的空间尺度来完成空间分析的统计学方法。空间自相关分析的目的是确定某一变量是否在空间上相关,其相关程度如何。空间自相关系数常用来定量地描述事物在空间上的依赖关系。
具体地说,空间自相关系数是用来度量物理或生态学变量在空间上的分布特征及其对领域的影响程度。如果某一变量的值随着测定距离的缩小而变得更相似,这一变量呈空间正相关;若所测值随距离的缩小而更为不同,则称之为空间负相关;若所测值不表现出任何空间依赖关系,那么,这一变量表现出空间不相关性或空间随机性。
空间自相关分析一般涉及3个步骤:①取样,②计算空
原创力文档


文档评论(0)