题目捷运流量样态分析-利用k-means与时间序列模型寻找顾客群与.pdfVIP

题目捷运流量样态分析-利用k-means与时间序列模型寻找顾客群与.pdf

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
题目捷运流量样态分析-利用k-means与时间序列模型寻找顾客群与

題目:捷運流量樣態分析-利用 K-means與時間序列模型尋找顧客群與分時預測 研究目的: 1. 設計方法統計捷運各站分時流量。 2. 利用時間序列模型預測捷運時流量。 3. 配合人口特徵資料找出捷運主要客群結構。 4. 針對不同群體制定商業活動,試圖達到精準行銷。 研究方法摘要: 1. 使用時間序列模型對捷運分時流量建模 2. 使用K-means分群找出客群結構 研究成果摘要: 1. 使用所建立之 SARIMA模型可準確預測一日的流量(三周訓練資料) 2. 利用K-mean分出差異較大的五個族群,找出常用與不常用的捷運族群 隊名:三天沒洗澡 參賽者:黃歆貽、賴汶靖、朱峻弘、吳予耀 指導老師:黃禮珊 壹、問題陳述與題目訂定 近年交通流量的調查被視為重要之議題,不論是對於火車流量與票價間的探討、高速公路 流量預測以研擬舒緩交通之配套措施,亦或是根據流量統計與預測提供用路人更好的規劃。而 本研究希望透過分析捷運流量資料,進而預測捷運分時流量,並根據人口特徵資料找出捷運主 要客群,針對不同群體應制定何種商業活動進行探討。 本研究以捷運流量為主要分析資料,研究目的如下: 1. 設計方法統計捷運各站時流量。 2. 利用時間序列模型預測捷運時流量。 3. 配合人口特徵資料找出捷運主要客群結構。 4. 針對不同群體制定商業活動,試圖達到精準行銷。 透過分析捷運 OD(Original Destination)資料統計出各站時流量,並透過時間序列模型預測各 站時流量。此外,藉由捷運各站分時進站流量與各村里人口特徵資料,探討捷運搭乘客群,藉 此制定合宜商業活動。為了達到上述之目的,本研究以Dijkstra演算法統計捷運各站時流量、 以含季節性時間序列模型(SARIMA)預測時流量、K-means 分群演算法找出捷運搭乘客群。 因此,本研究之題目為「捷運流量樣態分析-利用 K-means 與時間序列模型尋找顧客群與 分時預測」。 貳、資料介紹與處理 一、捷運分時OD資料 所使用的資料為台北捷運一月份每日分時各站 OD 統計資料,每筆資料所對應的時段為出 站時間,以表一的最後一筆為例,代表 0:00~0:59這段時間有 4個人是從松山機場進站,內湖 出站。總資料有7,581,601筆,當中共有 59,973,222累積乘車人次,資料中共有 108個站點。 表一、每日分時各站OD 流量統計資料 圖一、台北捷運目前 107站站點圖     假設進出站時間皆在同一時段,將 OD資料轉換成每天各時段、站點與站點間目前的乘車 人次資料。每一段區間都會依照上行、下行而有不同的箭頭方向,此步驟是將各日期、各時段 的區間人次資料合併並統整。 圖二、 OD資料轉區間人次資料示意圖 但在整理 OD資料與區間人次資料轉換時,其實並沒有這麼順利,一個起點、終點站只會 有一種路線,藉由圖二也可以發現此事,例如從松江南京站到台北車站其實就有好多種不同的 乘車方式,那若遇到這種多路線的乘車方式時,要怎麼將這筆資料轉換成區間累積人次是我們 一開始面臨的一大挑戰。最終我們利用Dijkstra演算法幫助我們找出兩個站點間的最短搭乘路 徑,(這裡我們是假設相鄰兩站的距離皆相同下使用此演算法,之後也可以藉由得到各站點間 實際搭乘時間、距離得到真實的距離權重 ) 。 二、捷運進站時資料 表二、捷運時進站資料以105 年1月為例(僅擷取部分) 105 年的捷運時進站資料如表二之格式,每站共有7,694筆資料,從每日上午 5點至隔日凌 晨 1時,利用此資料各捷運站的進站人數分別將其分配至對應的村里,藉此與人口結構資料結 合。然而,時捷運進站資料雖為每日早上 5時至隔日凌晨 1時,但是下午 5時過後之進站,可     能是因為乘客在早上由某一站出站後,下午必須回程則有進站紀錄,若是這樣法將進站乘車的 紀錄準確對應至各村里的人口特徵,因此我們排除下午 5時以後之進站紀錄 即僅取用上午( 5 時至下午 4時之資料 ) 。 三、人口結構資料

文档评论(0)

ailuojue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档