- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
轨道交通事故频发,但真正原因却不得而知。本文作者通过科学的数据分析,为我们提供了更多排查方法,一起来涨涨姿势吧~
全文翻译自新加坡GovTech发布在Medium上的官方博客How the Circle Line rogue train was caught with data,由DataGirls团队翻译。
新加坡地铁环线近几个月来发生了一系列不明原因的故障,给上千名乘客造成了困扰和麻烦。和我的大多数同事一样,我每天早上都要搭乘环线去上班。前不久,当我们组被任命调查故障原因时,我毫不犹豫地报名参与其中。
从地铁运营方SMRT和道路管理局之前的调查中,我们已经知道这些故障是由于会引发信号丢失的信号干扰所导致的。信号丢失会触发列车的紧急制动安全系统从而致使列车不规律地停止行驶。但是这些发生自八月份的故障看起来都是随机发生的,这给调查组的原因排查带来了不小的困难。
我们从SMRT获得的数据可以提供如下信息:
·?每一起故障的日期和时间
· 每一起故障的发生地点
·?故障列车的编号
·?故障列车的行驶方向
我们从清理原始数据入手。我们使用的软件是Jupyter Notebook,它是一款非常流行的用于编写和归档Python代码的工具。
—— 最基本的可视化 ——
从如下这些基本的分析处理中,我们无法确定故障的明确原因:
1.?故障发生的时间遍及全天,并且早晚高峰的故障发生次数呈镜像对称。
2.?故障发生在环线沿线多处地点,在西部发生的次数略多。
3.??信号干扰影响到多列列车。“PV**”代表列车编号。
—— Marey图:对时间、地点、行驶方向的可视化 ——
分析处理的下一步是综合考虑多个维度的信息。我们受到Marey图的启发,Marey图是Edward Tufte在1983年经典的“量化信息的可视化表达”一文中提出的。最近,Marey图被Mike Barry和Brian Card用于波士顿地铁系统的可视化项目中:
在这幅图中,纵轴代表时间——从上到下按照时间顺序——横轴代表地铁沿线各个站点。其中对角线代表地铁的行进状态。
我们先按照我们要研究的问题画好坐标轴:
在正常情况下,一列从港湾站行驶至多美歌站的列车将会按照下图的路线运行,每一趟单程仅需一小时。我们研究的目的是在该图中用点而非直线来描绘故障的发生状况。
—— 准备用于可视化的数据 ——
首先,我们把由三个字母代表的站名转化为数字:
·?滨海湾至宝门廊:0至1.5
·?多美歌至港湾:2至29
如果故障发生在两站之间,我们将用0.5加上两站中较小的数字来表示故障地点。举例来说,如果故障发生在港湾(29)和直落布兰雅(28),那么故障发生地点为“28.5”。这使我们在横轴上的标注变得简单明了。
基于处理之后的数据,我们在图中绘制出了所有紧急制动故障的散点图。每一个点代表一起故障。然而,我们还是无法归纳出明确的故障发生原因。
接下来,我们加入列车行驶方向这一因素。我们用指左或指右的三角形符号来代表列车的行驶方向:
然而,它看起来还是相当随机。但是当我们放大至一些局部细节,一些规律似乎浮出水面:
如果你仔细研究这幅图,你会发现:列车故障是依序发生的。当某一列车发生信号干扰,紧随其后开往同一方向的列车将会很快也遭遇相同的干扰。
—— 信号干扰是如何发生的? ——
至此,我们仍然不清楚是否某一列车是肇事元凶。我们能够确定的是在时间和地点的分布上一些规律有迹可循:故障是依次交替在相反方向上发生。会不会是一些无法在数据集中体现的原因导致这些故障呢?
这些假想的连接各点的虚线看起来与Marey图中的直线很相似。那些沿相反方向行驶的列车会不会是造成信号干扰的原因呢?我们决定去测试一下“肇事列车”这一假设。
我们已经知道环线每两站之间的时间间隔大约是2-4分钟。这意味着我们可以把四分钟之内发生的紧急制动故障归为一组。
然后,我们使用不相交的数据结构将所有的故障事件对组合成较大的集合。这使我们能够将可能与同一列肇事列车挂钩的故障进行分组。
我们把这一算法运用在数据集上,如下是我们找出的一些归类的集群及相应结果:
这一结果表明:在数据集中包括的259起故障中,189起——或73%的故障——可以用“肇事列车”这一假设来解释。这让我们觉得我们的分析方向是正确的。
我们根据聚类结果对故障点进行着色。同一颜色的三角形来自同一集群。
—— 有多少列肇事列车? ——
从前文可知,环线每一单程大约耗时一小时。我们按照正常运行的列车Marey图中的直线来拟合故障散点图。从下图可以清晰地看出只有一列肇事列车。
我们还可以得出:那列未知的肇事列车自身并没有出现任何信号故障,因为它并没有出现在我们的散点图中。
—— 找出肇事列车 ——
日落之后,我们前往金泉地铁车辆段试图找出肇事列车。由于SMRT需要更多时间来导出当日数
您可能关注的文档
最近下载
- 卓越研究生英语(人文篇)综合教程1--Unit 4_new.pptx VIP
- 湖南省师范大学附属中学2025-2026学年高三上学期10月月考英语试题(含答案).docx VIP
- 2026华能西安热工研究院校园招聘考试备考题库及答案解析.docx VIP
- 《企业内部控制》教学课件最终版 7.投资活动课件新 7.8第七章企业投资活动内部控制的流程.ppt VIP
- 2025年河南地矿职业学院单招职业技能测试题库附答案(a卷).docx
- TB-T30010-2023铁路信号显示规范.pdf VIP
- 《管理会计实务》习题答案.pdf VIP
- 2.2 会计要素 - 负债.pptx VIP
- 打击网络诈骗 加强自我保护---主题班会课件.pptx VIP
- 国家安全法知识竞赛题库及答案.docx VIP
原创力文档


文档评论(0)