- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
题目捷运流量样态分析-利用k-means与时间序列模型寻找顾客群与
題目:捷運流量樣態分析-利用 K-means與時間序列模型尋找顧客群與分時預測
研究目的:
1. 設計方法統計捷運各站分時流量。
2. 利用時間序列模型預測捷運時流量。
3. 配合人口特徵資料找出捷運主要客群結構。
4. 針對不同群體制定商業活動,試圖達到精準行銷。
研究方法摘要:
1. 使用時間序列模型對捷運分時流量建模
2. 使用K-means分群找出客群結構
研究成果摘要:
1. 使用所建立之 SARIMA模型可準確預測一日的流量(三周訓練資料)
2. 利用K-mean分出差異較大的五個族群,找出常用與不常用的捷運族群
隊名:三天沒洗澡
參賽者:黃歆貽、賴汶靖、朱峻弘、吳予耀
指導老師:黃禮珊
壹、問題陳述與題目訂定
近年交通流量的調查被視為重要之議題,不論是對於火車流量與票價間的探討、高速公路
流量預測以研擬舒緩交通之配套措施,亦或是根據流量統計與預測提供用路人更好的規劃。而
本研究希望透過分析捷運流量資料,進而預測捷運分時流量,並根據人口特徵資料找出捷運主
要客群,針對不同群體應制定何種商業活動進行探討。
本研究以捷運流量為主要分析資料,研究目的如下:
1. 設計方法統計捷運各站時流量。
2. 利用時間序列模型預測捷運時流量。
3. 配合人口特徵資料找出捷運主要客群結構。
4. 針對不同群體制定商業活動,試圖達到精準行銷。
透過分析捷運 OD(Original Destination)資料統計出各站時流量,並透過時間序列模型預測各
站時流量。此外,藉由捷運各站分時進站流量與各村里人口特徵資料,探討捷運搭乘客群,藉
此制定合宜商業活動。為了達到上述之目的,本研究以Dijkstra演算法統計捷運各站時流量、
以含季節性時間序列模型(SARIMA)預測時流量、K-means 分群演算法找出捷運搭乘客群。
因此,本研究之題目為「捷運流量樣態分析-利用 K-means 與時間序列模型尋找顧客群與
分時預測」。
貳、資料介紹與處理
一、捷運分時OD資料
所使用的資料為台北捷運一月份每日分時各站 OD 統計資料,每筆資料所對應的時段為出
站時間,以表一的最後一筆為例,代表 0:00~0:59這段時間有 4個人是從松山機場進站,內湖
出站。總資料有7,581,601筆,當中共有 59,973,222累積乘車人次,資料中共有 108個站點。
表一、每日分時各站OD 流量統計資料
圖一、台北捷運目前 107站站點圖
假設進出站時間皆在同一時段,將 OD資料轉換成每天各時段、站點與站點間目前的乘車
人次資料。每一段區間都會依照上行、下行而有不同的箭頭方向,此步驟是將各日期、各時段
的區間人次資料合併並統整。
圖二、 OD資料轉區間人次資料示意圖
但在整理 OD資料與區間人次資料轉換時,其實並沒有這麼順利,一個起點、終點站只會
有一種路線,藉由圖二也可以發現此事,例如從松江南京站到台北車站其實就有好多種不同的
乘車方式,那若遇到這種多路線的乘車方式時,要怎麼將這筆資料轉換成區間累積人次是我們
一開始面臨的一大挑戰。最終我們利用Dijkstra演算法幫助我們找出兩個站點間的最短搭乘路
徑,(這裡我們是假設相鄰兩站的距離皆相同下使用此演算法,之後也可以藉由得到各站點間
實際搭乘時間、距離得到真實的距離權重 ) 。
二、捷運進站時資料
表二、捷運時進站資料以105 年1月為例(僅擷取部分)
105 年的捷運時進站資料如表二之格式,每站共有7,694筆資料,從每日上午 5點至隔日凌
晨 1時,利用此資料各捷運站的進站人數分別將其分配至對應的村里,藉此與人口結構資料結
合。然而,時捷運進站資料雖為每日早上 5時至隔日凌晨 1時,但是下午 5時過後之進站,可
能是因為乘客在早上由某一站出站後,下午必須回程則有進站紀錄,若是這樣法將進站乘車的
紀錄準確對應至各村里的人口特徵,因此我們排除下午 5時以後之進站紀錄 即僅取用上午( 5
時至下午 4時之資料 ) 。
三、人口結構資料
您可能关注的文档
- 叙事转换的前提.ppt
- 则电路进入稳态后的电流和电压响应将是非正弦周期函数.ppt
- 性别与空间华南师范大学政治与行政学院王宏维genderand.ppt
- 酒精饮料质量安全和真伪鉴别技术qualitycontriolandauthenticity.pdf
- 滚珠丝杠的附件.pdf
- 俄罗斯联邦简介.ppt
- zollertms刀具管理解决方案.pdf
- gst工商行政管理网络建设规范江西工商局.doc
- splunk使用指引与智能运维-10data.pdf
- 直播cdn架构20—明确源站定位.pdf
- 2.1神经调节的结构基础 课件 人教版高中生物学选择性必修1.pptx
- 2.2.1算术平方根 课件 北师大版数学八年级上册.pptx
- 2.3.1细胞通过分裂而增殖 课件(内嵌视频3个)初中生物学北师大版(2024)七年级上册.pptx
- 2.3.2细胞分化形成组织 课件 初中生物学北师大版(2024)七年级上册.pptx
- 4.3.1 角与角的大小比较 课件 2025-2026学年湘教版数学七年级上册.pptx
- 2.3.3生物体的器官、系统 课件 初中生物学北师大版(2024)七年级上册.pptx
- 聚异氰酸酯行业商业计划书.docx
- 2.4节神经系统的分级调节 课件 人教版高中生物学选择性必修1.pptx
- 【公开课】探索勾股定理第1课时(课件)数学北师大版2024八年级上册.pptx
- 综合实践 一天的时间(课件)2025-2026学年度苏教版数学三年级上册.pptx
最近下载
- 绿城好房子体系.pptx
- AI在计算机科学教学中的应用论文.docx
- 人教版七年级历史下册期末试卷(含答案).pdf VIP
- 员工手册电子版员工手册电子版.doc VIP
- 【高考数学押题卷】2025年全国100所名校高考模拟示范卷七含答案或解析.pdf
- 孚瑞肯FR100系列变频器使用说明书.pdf
- 开放系统22226《物业管理实务(2)》期末机考真题及答案(第101套).docx
- 武侯区2018-2019学年五年级下数学调考试卷-.pdf VIP
- 尪痹(类风湿关节炎)中医护理效果评价表.docx VIP
- J B-T 10441.3-2004 电工用皱纹绝缘纸 第3部分 技术要求.pdf VIP
文档评论(0)