基于集成学习的高时空分辨率人口空间化研究.pdfVIP

基于集成学习的高时空分辨率人口空间化研究.pdf

  1. 1、本文档共112页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

人口数据是社会经济发展关注的核心基础数据,权威的人口数据主要来

自于国家统计部门的人口普查和人口抽样调查。但是,人口普查数据存在更

新周期过长、精细化程度不足等问题,因此,针对人口普查数据进行深度开

发,实现城市人口在精细尺度的空间推演,构建高精度、可动态更新的人口格

网数据集,对于正确认识人口分布特征、助力城市规划建设和提高社会综合

管理能力具有重要意义。最新人口空间化研究主要采用机器学习或地理加权

回归模型,分别将人口分布的非线性影响和人口分布的空间异质性纳入研究,

但是现实中这两种影响通常同时存在,将二者分开分析会使得人口空间分布

刻画不全面、模拟精度低。目前,针对这一问题的人口空间化研究还相对较

少,本研究由此切入,以传统人口空间化数据和新型地理大数据为基础,采用

地理加权回归+机器学习模型的集成学习方法进行人口空间化研究。

研究过程中,首先对人口空间化的基础数据和方法模型进行细致的文献

总结和整理,奠定本文研究的理论基础;实证部分主要分为两个阶段,第一阶

段选择成都市全域为研究范围,将刻画自然条件的海拔高度、坡度、地形起伏

度和描述经济社会发展水平的土地利用情况、夜间灯光亮度值、兴趣点核密

度值以及路网密度值,作为表示人口分布的影响因素,以成都市2020年最新

的七普乡镇街道人口统计数据为因变量,分别采用随机森林、XGBoost、加权

平均堆叠、多元线性回归堆叠和地理加权回归堆叠构建集成学习模型,生成

1km人口格网数据集,并对各模型拟合精度进行定量和定性验证;第二阶段

一方面提取百度人口热力值在局部单元变化的趋势规律,构建以小时为单位

动态更新的1km格网数据集,另一方面采用城市住宅小区面数据、建筑物矢

量数据和地理位置大数据,将1km格网人口数据下推至建筑物尺度,对大城

市人口格网数据集时空分辨率的提升进行探究。研究主要结论为:

基于集成学习的高时空分辨率人口空间化研究

第一,就人口空间化方法与模型研究而言,实证研究表明对于大中型城

市的乡镇街道尺度而言,本研究所采用的模型在人口空间化拟合效果上均优

于WorldPop数据集,其中将人口空间分布的关联性和异质性纳入模型构建中

的机器学习+地理加权回归的集成模型表现最为优秀,拟合结果在细节刻画和

拟合精度两个方面均优于单模型和传统集成模型,是一种针对大中型城市,

较好提高人口空间化效果的方法。具体而言,其生成的1km人口格网数据集

较WorldPop数据集而言,拟合人口密度与实际人口密度的平均绝对误差提升

了55.34%,均方根误差提升了74.83%,有显著的精度提升效果。

第二,在人口格网数据集时空分辨率提升研究中,空间维度上,利用城市

小区面状和建筑物矢量数据进行高精度建筑尺度的人口分布推演,取得了较

好拟合效果;时间维度上,通过百度人口热力值获取成都市全域以格网为单

元的日内人口变化趋势,实现对城市全量人口空间分布及其变化的推演,发

现拟合效果在人口总数方面的平均相对误差仅有2.83%,分区县验证拟合人

口总数变化趋势与实际百度人口热力值变化趋势的斯皮尔曼相关系数发现,

利用人口热力值对格网人口数据进行动态更新这一方法,在人口聚集度高、

流动性频繁的城市中心及近郊区效果较好。

综上,本研究认为基于多源地理数据、城市小区面数据、建筑物矢量数据

和新型地理定位大数据,采用机器学习+地理加权回归作为建模方法,是进行

高时空分辨率人口空间化的有效方法。

关键词:人口空间化;机器学习;地理加权回归;集成模型;高时空分辨率

Abstract

Populationdataisthecorebasicdataconcernedbysocialandeconomic

development,andtheauthoritativepopulationdatamainlycomesfromthecensus

andpopulationsamplesurveyofthenationalstati

文档评论(0)

136****6583 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档