应用大数据的居民出行调查扩样校核技术研究.pdfVIP

应用大数据的居民出行调查扩样校核技术研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用大数据的居民出行调查扩样校核技术研究 董志国 【摘要】当前居民出行调查存在母体人口库信息不全面、抽样方法不严谨、样本换户率及出行漏报率 高等情况,导致调查质量不够理想,调查数据无法直接使用,只有经过调查综合扩样校核过程,调查成果 才能真实反映城市交通特征。而大数据在反映某些城市交通特征方面具有样本规模大和客观真实等特点, 使得它们在调查综合扩样校核工作中的作用日益突出。本论文以上海2014 年综合交通调查为例,详细论述 了居民出行调查综合扩样校核工作的技术流程和关键要点,以及大数据在其中的应用情况。同时提出大数 据应用应注意样本偏差问题和坏数据、大误差数据的甄别等,否则大数据可能导致“大错误”。 【关键词】居民出行调查;人口扩样;出行校核;大数据 居民出行调查是为开展交通规划、政策和设施建设等研究所必需的核心调查项目,也是 研制交通模型的重要基础数据来源。居民出行调查通常采用入户(或电话)问询方式,了解 受访对象的家庭、个人的基本情况和交通出行状况。但是随着人们日益注重居住场所私密性 和个人活动隐私性的保护,受访对象对调查形式和内容的抵触心理不断增加,存在入户难、 出行隐瞒等问题,导致调查样本的换户率高、出行漏报率高,造成调查数据存在一定程度的 失真情况。 为使调查成果真实反映城市交通特征,许多城市都十分重视调查数据的综合扩样校核工 作。而大数据在反映某些城市交通特征方面具有规模大、全天候、自动化等优点,在调查综 合扩样校核工作中的作用日益突出。本论文以上海2014 年综合交通调查为例,详细论述了 居民出行调查综合扩样校核工作的技术流程和关键要点,以及大数据在其中的应用情况。并 专门提醒大数据应用时应注意样本偏差、数据异常等问题,否则大数据可能导致“大错误”。 1 居民出行调查存在的主要问题 当前居民出行调查主要存在四个方面问题,对调查数据质量造成一定影响。 一是用于抽样的母体库信息不够全面。即便是最详细的人口普查数据库,也只有户规 模和人口年龄、职业等基本信息,而缺少交通工具拥有状况等其他一些与交通行为有密切关 系的重要信息,易导致样本偏差。比如,是否拥有小汽车对于调查对象选择交通方式的类别 有重要影响,如果调查样本的家庭小汽车拥有结构与母体存在一定偏差,则调查数据统计的 交通方式结构必然也存在一定误差。 1 二是抽样方法不够严谨。有的城市为了便于开展调查实施工作,一般只是按照户地址 分布信息进行抽样,并不考虑年龄、职业、交通工具拥有状况等其他特征信息。还有的城市 在确定不同地区的调查户数时采用严格的抽样方法,比如街道、居委会等,而在确定该地区 内部的具体调查户时,仅选择少数住宅楼宇按照户门牌号进行连续抽样,个别调查甚至是凭 调查员喜好而定。调查方法不够严谨必然导致样本偏差。 三是入户难导致样本换户率较高。随着人们对于个人隐私保护意识的不断增强,一些 家庭对于入户调查问询形式和内容有较强的抵触心理,部分被抽中的家庭拒绝接受调查,而 调查员为了保证样本数量,不得不临时更换其他户进行调查,导致实际调查户并不完全符合 调查抽样设计方案,导致调查样本出现偏差。 四是出行隐瞒导致出行漏报率较高。一些家庭在接受调查时,只愿意提供上下班(学) 等常规通勤出行信息,不愿意提供业务、生活、娱乐等其他活动信息,导致调查数据的出行 记录存在一定的漏报率。特别是一些社会中高阶层人群或者20-40 岁年龄段人群的出行隐瞒 情况较为突出,而恰恰是这些人群的社会活动较多、出行机动化水平较高,在城市交通需求 总量中占有较大比重。出行漏报较高情况导致调查数据存在一定程度 “失真”。 上述主要问题导致调查数据无法直接使用。为使调查成果能够真实反映城市交通实际 特征,调查数据进行综合扩样校核是必不可少的。 2 居民出行调查的人口扩样技术研究 调查数据的综合扩样校核技术环节包括人口扩样和出行校核两个阶段。人口扩样的目的 是确保调查成果的人口结构与母体人口库保持一致。 2.1 人口扩样技术方法 简单的人口扩样方法是采用抽样率的倒数作为人口扩样系数。但是由于在抽样过程中存 在母体信息库不完整、抽样方法不严谨等问题所导致的样本偏差,所以该方法显然是不适用 的。 本论文论述的人口扩样方法,是指选取与交通行为显著相关的

文档评论(0)

喜宝 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档