探勘不平衡资料集中之突显样式-以国道事故资料为实证研究-GEBRC.PDFVIP

探勘不平衡资料集中之突显样式-以国道事故资料为实证研究-GEBRC.PDF

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
探勘不平衡资料集中之突显样式-以国道事故资料为实证研究-GEBRC

探勘不平衡資料集中之突顯樣式-以國道事故資料為實證研究 161 鄭麗珍、李麗美(2014 ),『探勘不平衡資料集中之突顯樣式-以國道事故資料為 實證研究』,資訊管理學報 ,第二十一卷,第二期,頁161-184 。 探勘不平衡資料集中之突顯樣式-以國道事故 資料為實證研究 鄭麗珍* 東吳大學資訊管理學系 李麗美 交通部臺灣區國道高速公路局 摘要 在資料探勘的分類問題中,大多數演算法都是設計在資料類別分布平均的情 況下去訓練分類模型。然而,在實務應用上,資料類別分布不平衡是常見的狀況, 在這樣的資料集設計的分類方法是很重要的研究議題。此外,透過分類模型所找 到的規則常瑣碎複雜,透過突顯樣式探勘可以整理篩選出具有區分找出兩個類別 之間的顯著差異與獨特識別的規則。然而 ,過去沒有相關研究在不平衡資料集上 作突顯樣式探勘。本研究提出一個新的研究架構,基於關聯規則分類的方法,調 整資料的權重於計算支持度,以探勘出不平衡資料集之突顯樣式,並加入不同年 份間的突顯樣式變化探勘。本研究以真實之國道交通事故資料集為實證基礎,此 資料為一個嚴重不平衡的資料集,死亡事故僅佔全部事故資料的百分之一比例都 不到。然而,主管機關一直努力探求了解死亡事故發生原因,希望可以透過各項 因應措施,增進行車安全減低死亡事故發生。本研究將透過提出之研究架構,找 出一般及稀有死亡事故的肇事因子間關聯,並分析不同年度間肇事因子,找出一 些重要的樣式,提供交通管理單位參考。 關鍵詞:關聯規則分類、突顯樣式、不平衡資料集、高速公路事故、權重支持度 * 本文通訊作者。電子郵件信箱:lijen.cheng@ 2013/7/27 投稿;2013/10/1 修訂;2013/12/17 接受 162 資訊管理學報 第二十一卷 第二期 Cheng, L.C. and Lee, L.M. (2014), ‘Mining Emerging Patterns from Imbalance Dataset – A Case Study on Freeway Accident Database’, Journal of Information Management, Vol. 21, No. 2, pp. 161-184 Mining Emerging Patterns from Imbalance Dataset – A Case Study on Freeway Accident Database Li-Chen Cheng* Department of Computer Science and Information Management, Soochow University Li-Mei Lee Taiwan Area National Freeway Bureau, MOTC Abstract Traditional associative classification is used to search frequent patterns at the balance datasets. However, most real life datasets are imbalance. To discover special rare patterns from imbalance dataset

您可能关注的文档

文档评论(0)

sunshaoying + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档