基于公交IC卡客流数据站点匹配方法.docVIP

下载本文档

8
0
约3.87千字
约 9页
2018-08-29 发布于福建
举报
版权申诉

基于公交IC卡客流数据站点匹配方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于公交IC卡客流数据站点匹配方法

基于公交IC卡客流数据站点匹配方法　　摘要公共交通已成为市民出行的重要交通工具，分析研究公共交通客流数据并对相关规律进行分析，有助于掌握市民出行规律，并依此优化城市公交网络。在已有聚类分析方法的基础上，本文基于公交IC卡刷卡数据的多个类聚点，提出一种通过GPS定位、乘客“闭环”出行、以及出行规律等条件，对已聚类点进行上车站点的匹配和下车站点判断方法。利用公交IC卡数据可得到满意地匹配和推断上、下车站点，为研究大规模出行规律提供基础。　　【关键词】公交IC卡聚类分析站点匹配　　1 K-means聚类方法的局限与改进　　K-means聚类算法是目前聚类算法中十分普遍常用的算法。K-means算法高效便捷、简单快速，但是在实际的操作中我们不难发现，K-means算法在确定初始K值、初始凝聚点确定等问题上仍存在很大的不确定性。加之K-means算法采用欧几里得距离最为相似性度量的依据，而欧几里得距离仅适用于分布均匀且呈类球形的数据，实际使用过程中会出现很多问题，为此，我们对K-means聚类算法提出了改进。　　该算法对两个数据之间的距离进行测量。当两个数据之间的距离较远时，结果值较大；完全一致时结果值为0。m作为不同簇的生成值中心点，n作为等待划分点。当等待划分点与中心点距离接近时，两个值的差距较小，即K-means值越小；当等待划分点与中心点一致时，K-means值则为0。作为K-means聚类方法的改进，该算法也可用于其他类型的数据。其公式可表示为：　　其中，mj代表第j类的生成值中心点，ni代表第i个等待划分点。该公式的使用条件是mj和ni为非负数。当和中不全为正数时，令　　。当mj与ni距离越大时，的值越大。　　2 上车站点匹配　　已知研究的公交线路有m个站点，利用上述方法可将实验数据聚类成n个点。通过比较n与m之间的关系，可以将已类聚的点与对应车站进行匹配。在聚类方法正确的情况下，将不会出现mn时，说明公交车在行驶过程中有过站未停车现象，也就是我们俗称的“跳站”。目前，部分城市正在推进公交GPS的应用，但仍未完全普及。本文依次提出利用GPS数据和不利用GPS数据两种匹配上车站点的方法来完成mn情况下的上车站点匹配。而基于乘客出行的规律性及当前中国公交站点分布的规律性与稳定性，我们将利用乘客的上车信息推算其下车信息。前文中，我们已讨论了基于IC卡刷卡信息得到其上车站点的方法。根据上车站点的关联程度，我们可以以出行线路是否呈现闭合状态为判定条件，从而进一步加以研究。　　2.1 利用GPS数据匹配上车站点的方法　　该方法将GPS数据与公交IC卡数据进行混合处理，通过公交车辆在不同站点的行驶时间与乘客的刷卡时间进行比对，从而将地理信息位置和乘客的上车站点进行匹配。在基于GPS技术的公交站点匹配上由于GPS数据存在延时性，即非实时数据，因此与公交车辆的实时地理位置存在一定偏差，需要量化两者的时间偏差，由于不同的公交系统GPS数据延时不同，本文对该偏差不予以考虑。　　匹配步骤如下：　　步骤1：获取同一聚类点下乘客刷卡的交易时间，依据不同乘客的刷卡时间，确定一个可以代表此批次乘客刷卡时间的特征时间点。　　步骤2：将步骤一中获得的特征时间点与对应线路、车辆的记录时间进行匹配，获取该时刻下的经度与纬度。　　步骤3：将步骤二中获得的坐标与对应公交线路的坐标进行匹配，求得对应公交线路中直线距离最小的公交站点。　　步骤四求得直线距离最小的车站，即为该聚类点匹配的上车点。　　2.2 不利用GPS数据匹配上车站点的方法　　由于日常生活中存在交通拥堵或者某站点没有乘客上下车等问题，因此根据居民的出行规律将公交线路在不同站点的时间间隔进行划分。根据实际调研及相关数据处理，以南京市栖霞区为例，获得该区域内交通高峰调查结果如表1所示。　　同时，将大量实际调研数据进行分析，可以推断出公交车相邻两站运行时间间隔的阈值，部分调查结果如表2所示。　　主要处理步骤如下：　　步骤1：依次将聚类得到点按时间顺序与已有站点匹配，并依据表1中信息判断时间是否属于高峰时段。　　步骤2：在表2中寻找其相邻两站运行时间阈值。若小于阈值，则代表两站相邻；若大于阈值，则代表“跳站”行驶。　　步骤3：以此类推，完成所有站点的匹配。　　2.3 “闭合”公交出行线路下的下车站点推算　　所谓的“闭合”出行线路，是指某乘客某次出行经过多次公交换乘后的起止点均为同一地点，且换乘过程中连续。图1表示该乘客某次出行乘坐公交的过程为从A点连续换乘5次公交依次到达B点、C点、D点、E点并返回至A点的过程。　　在这种情况下我们可以发现，每次乘坐公交的上车点与上次乘坐的下车点距离极近甚至重合。由此，