- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于功能区划分出租车热点区域发现方法研究
基于功能区划分出租车热点区域发现方法研究
摘要:针对城市出租车分布不合理的问题,提出了一种基于功能区划分的出租车OD热点区域发现方法。首先对出租车的原始OD点进行提取,使用改进的DB-SCAN算法对功能区中的出租车OD点进行聚类,并用卡方分布的统计学方法得出热点区域。该方法的准确性和可信性可通过两个指标评估,覆盖率和命中率。实验结果表明,该方法能够有效地发现和预测不同时间段、不同功能区的出租车OD热点区域。
关键词:功能区;出租车OD热点区域;出租车分布;改进的DB-SCAN算法;卡方分布
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)25-5571-05
1 概述
目前,城市出租车已成为最重要的交通工具之,它具有方便、快捷、舒适等特点,受到越来越多出行者的亲睐[1]。出租车是城市客运交通的重要组成部分,是常规公共交通的重要补充[2]。但是目前存在严重的乘客打车难的问题,包括等待空车时间长,以及乘客在陌生地不知何处可以打车等。而上述所有问题,都能被归结为出租车分布不合理的问题。
已有学者针对此问题进行了研究。Hu, K, Z He等人[3]提出了一种解决问题的方法,他们的主要思想是将城区划分成多个行政区域,根据某区域在某一时间段内,该区域出租车为空载状态的数量占有该区域内所有出租车数量的比率,计算得到该区域的出租车空车率,根据区域空车率引导高空车率区域内的空车转移至低空车率区域,实现区域间出租车空车率均衡。这种方法能够使得城区内出租车数量均衡,但是由于行政区域的划分不能反映该区域内的人群出行特征,而不同出行特征的区域在不同时间段对于出租车的需求量是不同的。因此这种方法不能解决上述问题。
郑宇等人[4]提出的功能区方法将北京市按照居民出行以及POIs(points of interests)划分成多个功能区域,该功能区域的划分能够帮助人们清楚地了解复杂的都市区域特征,有利于各种应用如城市规划、企业选址、用户出行分析和社会建议等。该功能区域与行政区域的不同主要在于行政区域是按照政治和行政管理划分的,而功能区域划分是按照人群出行特征划分的。该功能区划分方法的优点是能够反映该区域内人群出行特征,分析时能更加清楚该区域的生活、工作、娱乐等能力。
2 热点区域发现
针对市民出行打车不方便,以及出租车空驶率高的问题,该文创新地提出一个基于功能区划分的出租车OD热点区域发现方法。该方法可以分为三个步骤:1)功能区内出租车OD点的筛选;2)功能区的网格划分及网格聚类权值计算;3)采用改进的DB-SCAN方法筛选功能区内网格,并采用卡方分布统计分析得出热点区域。
2.1 有关定义
2.2 数据处理
本文根据郑宇等人[4]提出的功能区发现方法,将北京城区划分为不同功能区域,将市区按照市民出行活动区域,划分为工作区、商业区以及生活区、车站等。在不同功能区域中,出入该区域的乘客人群具有明显的生活、工作规律,在时间上具有周期性。譬如在西单商业区,人群出行时间段集中在12点之后。根据功能区出行特点及人群出行的周期性,该文对于各功能区分时间段周期性研究其热点OD区域分布。从出租车原始数据中提取功能区域的行车OD数据,并对通过车载设备向交通信息中心传回的出租车载客原始数据筛选出OD点。
由于出租车行驶轨迹覆盖了整个北京公路网络,所以我们采用水平/垂直交叉点数判别法提取功能区域的OD点。通过上述方法很容易得到功能区域内的OD 点,对这些点采用改进的DB-SCAN算法进行聚类,剔除离群的OD点,形成一个个簇构成的区域,作为热点区域的候选对象。然后:
1)把功能区域划分成[r×r]的网格。由于各个功能区的道路宽度以及地形不相同,所以对于参数[r]的选定也不相同,参数[r]的可选值在表1中。根据落在每个网格内的OD点个数,确定每个网格的权值。网格密度初始化为0,将各个时间段聚类簇中的GPS点投射到各个网格中。如果GPS点属于该网格,该网格密度加1。这样就将发现热点区域的问题转换成根据每个网格权值大小进行聚类。
3 热点区域的覆盖率和命中率
本文选择时间从2012年1月1日到2012年12月30日,北京公路上12000辆汽车的原始GPS数据(包括经纬度位置、运行时间、载客状态、行驶速度和方向等信息[7])。每辆汽车每30秒至70秒上传一次GPS数据。测试地图选择北京四维图新的2012版本的地图底层,并选择分析区域为北京西站、国贸、望京和西单。
3.1 热点区域的覆盖率
本节讨论分析OD热点区域的覆盖率。以西单区域为例,基于本文中的方法对此区域第一季度的数据进行分析。区域中原始出租车OD点分布与聚类后划分的热点区域分布如图1所示,
文档评论(0)