- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于样本权重出租车聚集区识别算法
基于样本权重出租车聚集区识别算法 摘要:
聚类技术可以用于对具有动态、随机和异步并发特性的出租车对象进行分类。但是,现有的聚类技术认为每个出租车样本对聚类的贡献相同,没有考虑到不同样本的不同影响,这在一定程度上影响了聚类的精度。提出了一种基于样本权重的出租车聚集区识别算法――SFTA_IB算法,算法引入了样本权重来充分反映不同样本的贡献度。在此基础上,将出租车视为原变量X,出租车坐标数据视为相关变量Y,目标是寻求压缩变量T,在T中最大化保留相关变量的信息。实验表明,SFTA_IB算法可以准确识别目标样本周边的出租车聚集区,针对性地指导目标出租车个体的巡游线路,提高乘客搜寻效率。
关键词:
信息瓶颈; 样本权重;模式识别;出租车;聚集区
0引言
出租车是公共交通的重要组成部分,具有动态、随机和异步并发的特性[1]。出租车空载问题是智能交通的难题之一。传统的解决方法一般基于经济学模型、网络平衡数学模型和排队论/仿真模型[2]。近年来,聚类技术被广泛应用于交通分析领域,如交叉路口设置[3]、车辆路径规划[4]、交通小区/交通时段划分[5]、车辆轨迹模式发现等。聚类技术可以在没有先验知识的情况下对车辆对象进行分析,并根据“物以类聚”的道理对样本分类,在城市交通系统的规划、管理和控制方面取得了大量的成果。但是,现有的聚类技术认为每个车辆样本对聚类的贡献相同,没有考虑到不同样本对聚类结果的影响,在一定程度上影响了聚类的精度,并最终影响了车辆规划调度的合理性。因此,本文提出了一种基于样本权重的出租车聚集区识别算法――SFTA_IB算法。出租车全球定位系统(Global Positioning System, GPS)数据[6]动态地反映出城市中每个车辆的纬度、经度、速度、方向和状态信息,可以用一个七元组G={Id,Lo,La,Sp,Di,Sa,Ti}表示。其中:Id是车牌ID属性,Lo是纬度属性,La是经度属性,Sp是速度属性,Di是方向属性,Ti是时间属性。SFTA_IB算法将出租车视为原变量X,GPS数据视为相关变量Y。算法目标可描述为:假定出租车聚集簇个数k已知,寻求压缩变量T,在T中最大化保留相关变量Y的信息。同时,合理称量和调整原变量X中的各个样本xi的权重,以充分反映不同样本对聚类的不同贡献。实验表明,SFTA_IB算法可以准确识别样本周边的出租车聚集区,有效指导出租车个体巡游路线,以达到缩短乘客搜寻时间的目的。
4结语
出租车系统是一个动态、随机和异步并发的实时系统,出租车空载问题是出租车运行中的主要难题之一。传统上出租车调度和运行研究多基于经济学模型、网络平衡数学模型、排队论/仿真模型的相关研究。而近年来聚类技术被广泛地采用,利用GPS数据对出租车样本进行分类。但是,现有的聚类技术认为每个车辆样本对聚类的贡献相同,没有考虑到不同样本对聚类结果的影响,在一定程度上影响了聚类的精度,并最终影响了车辆规划调度的合理性。因此,提出了一种基于样本权重的出租车聚集区识别算法――SFTA_IB算法。
SFTA_IB算法基于信息瓶颈方法,将出租车视为原变量X,GPS数据视为相关变量Y。算法目标为:寻求原变量X的压缩变量T,在T中最大化保留相关变量Y的信息。同时,SFTA_IB算法中引入了基于经度差异和纬度差异的样本权重调整方法,以反映不同样本对聚类的贡献度。
本文的实验结果表明,SFTA_IB算法可以针对目标出租车,准确识别其周边的出租车聚集区,有效指导目标出租车的个体巡游路线。
下一阶段的研究方向包括如何提高SFTA_IB算法的实时性、实际道路中建筑、河流等障碍因素的引入,路况拥堵度等相关信息的引入等。
参考文献:
[1]
许宗定.我国出租汽车市场运营模式的探讨[J]. 城市公用事业, 2010,24(3):10-12.
[2]
慕晨,宣慧玉,张发.出租车运营中空车行为的仿真研究[J]. 系统工程学报, 2008,23(5):554-562.
[3]
胡列格,闫晓燕.基于灰色聚类分析法的交叉口交通环境影响评价[J].铁道科学与工程学报,2012,9(1):51-55.
[4]
李娅, 王东. 基于混沌扰动和邻域交换的蚁群算法求解车辆路径问题[J]. 计算机应用,2012,32(2):444-447.
[5]
吕玉强,秦勇,贾利民,等.基于出租车GPS数据聚类分析醮交通小区动态划分方法研究[J].物流技术,2010,29(9):86-88,135.
[6]
CHEN L. The design and realization of the information service system for
文档评论(0)