利用資料探勘技術 於台灣地區肇事危險判別之研究 the study of accident.ppt

利用資料探勘技術 於台灣地區肇事危險判別之研究 the study of accident.ppt

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
利用資料探勘技術 於台灣地區肇事危險判別之研究 the study of accident

道路障礙情形分析 視距狀況分析 號誌種類分析 號誌動作分析 路面狀態分析 時段分析 肇事集群分析 肇事集群分析集群分析方法主要有二種,一為階層集群分析法,二為 「非階層集群分析法」之 K平均法。由於實際應用上階層集群分析法所耗資源 與時間過於龐大,因此在實務上以非階層集群分析法為主。(吳明隆2002 ),也 提出:如果觀察值的個數較多或資料非常龐大200 個以上 ,以採「 平均集群 分析法」較為適宜。由於此研究之肇事資料高達十萬多筆資料,資料數過多之 餘,經過實際處理分析,階層式集群分析方法確實無法處理,因此採用 K-平均 法為本研究之集群分析法,以歐氏平方距離為距離衡量基準 根據 K-means 集群分析法之演算規則,使用 K-means 集群分析法時,要事 先訂定集群個數,在一般研究應用上,為使分析應用方便清晰,通常選用 3-10 個集群為主。根據本研究之資料性質與研究目的,並遵循個集群之個數不可差 異過大之原則下,決定將集群範圍定於 3-15 群之間。但為使集群分析能得到最 佳集群數,乃配合多變量統計法之判別分析,找出各維度下最合適集群數之門 檻值進行分析,作為進行 k-means分析法時之集群數選擇依據 肇事人維度集群 肇事人維度集群數選擇變化表情形可發現,經過不同集群數的分群結果,以分為五群時正判率為最高,隨後隨著集群數的增加而小幅變動,因此在肇事人維度上即以五群為最佳分群數 環境維度集群 環境維度集群數選擇變化表情形可發現,經過不同集群數的分群結果,在分為六群時正判率為最高,隨後隨著集群數的增加而逐漸遞減,因此可知環境維度上採用六群為最佳分群數 道路維度集群 道路維 集群數選擇變化表情形可發現,經過 度不同集群數的分群結果,在分為六群時正判率為最高,隨後隨著集群數的增加而持續遞減,因此在道路維度上即以六群為最佳分群數 車輛維度集群 車輛維度集群數選擇變化表情形可發現,經過不同集群數的分群結果,在第七群之後,正判率驟減,隨後又回覆穩定的 變化,因此七群的分群結果可視為一門檻值,因此在車輛維度上即以七群為最佳分群數 K-means 分群結果 本階段交將利用非階層集群分析法中採用較廣之 K 平均法,其演算步驟如 下: 將某一事物點分割成 K 個原始群落 2. 計算某一事物點到各群落中心(平均數)的距離,研究採用歐基里德平方 距離,然後將一些事物點分派到距離最近的那個群落。重新計算得到新事 物點的群落和喪失該事物點的群落兩者的重心。 3. 重複第二步驟,直到各事物點皆不須重新分派到其他群落為止。依據其演算 念,將資料庫 1 177 筆肇事資料,上節對最佳集群數的判 定結果,將肇事人 環境、道路、 輛四維度之影響變數分別分割成 5 6、6、 7 個原始群落 (即K=5~7)經由 SPSS 程式運算,K 平均數法計算流程與最後結果 肇事人維度變數群集結果 肇事人維度疊代紀錄 肇事人維度之最後群落中心點 環境維度之初始群落中心點 環境維度之疊代紀錄 環境維度之最後群落中心點 道路維度之初始群落中心點 道路維度之疊代紀錄 道路維度之最後群落中心點 車輛維度之初始群落中心點 車輛維度之疊代紀錄 車輛維度之最後群落中心點 結論 1.「在肇事者維度方面」 (1)肇事人維度上以五群為最佳分群數,判別正確率達99.7。可之肇事人維度集群分析之有效性,其顯著影響變項有性別、保護裝備情形、肇事者駕駛資格、肇事者駕照種類、肇事者飲酒情形、肇事者年齡。 (2)肇事者維度判別模式其影響判別變項共有男性、戴安全帽或繫安全帶、未戴安全帽或繫安全帶、不明裝備情形、有適當駕照、無照駕駛、駕照被吊銷吊扣、職業駕照、機車駕照、軍用駕照、特殊駕照、未飲酒、超過酒測標準、無法檢測之不明原因、30歲以下、30-40歲間、50-60歲間、60歲以上。共18個與肇事發生相關之影響變數。 (3)主要前三項影響變數分別是駕駛資格、保護裝備與年齡 2.「在環境維度方面」 (1)環境維度上以六群為最佳分群數,判別正確率達99.2﹪。可之環境維度集群分析之有效性,其顯著影響變項有天候狀況、光線情形、事故位置、道路障礙情形、視距情形、號誌種類、號誌動作、路面狀態。 (2)環境維度判別模式其影響判別變項共有暴風暴雨、雨、日間自然光線、塵或暮光、夜間無照明、交岔路口、路段、行車管制號誌附設行人專用號誌、閃光號誌、無號誌、號誌正常運作、號誌無運作。共13個與肇事發生相關之 影響變數。 (3)主要前三項影響變數分別是號誌動作、路面狀態與光線。在各危險程度下乃由此三項變數所主導。 3.「在道路維度方面」 (1)道路維度上以六群為最佳分群數,判別正確率達98.

文档评论(0)

精华文库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7111022151000002

1亿VIP精品文档

相关文档