网站大量收购闲置独家精品文档,联系QQ:2885784924

在时间序列上探勘频繁情节-NPUCSIE.PDF

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 十三屆離島資訊技術與應用研討會論文集 在時間序列上 探勘頻繁情節 * 顏秀珍 李御璽 粘嘉菖 銘傳大學資訊工程學系 銘傳大學資訊工程學系 銘傳大學資訊工程學系 sjyen@.tw leeys@.tw ruaddick@ 論文摘要 是從一連串事件發生的時間序列,找尋頻繁依序發 資料探勘技術在資料分析上面有很大的幫 生的事件,也就是發生某一事件後,哪一事件很有 助,在時間序列上找尋頻繁的情節(episode)是其中 可能會接著發生。因此,當某一事件發生後,我們 一種。探勘頻繁情節能讓使用者根據目前發生的事 可以利用頻繁情節來預測將會發生的事件。例如網 件,預測未來發生的事件。傳統探勘頻繁情節都是 路錯誤偵測的應用中,我們可以利用頻繁情節來預 利用階層式的概念,即先產生候選情節 (candidate 測錯誤的發生,而在氣象的應用中,可以預測天氣 episodes) ,再掃描序列資料,以決定其是否為頻繁 的變化。一連串事件發生的序列,我們稱為事件 序 情節。因而浪費了很多重覆掃描序列資料以及搜尋 列(event sequence) ,如圖1所示,英文字母代表事 候選情節的時間。另外,時間序列上的資料會隨著 件的型態,而數字代表事件發生的時間點,我們可 時間不斷的增加,浪費很多重新探勘的時間,資料 以將事件序列記錄成一序列的事件與其發生時間 連續不斷無止境增加的環境稱為資料串流,在很多 的組合。因此,事件序列的表示方式為 a ,t )(a ,t )…(a ,t )(n1),其中t t …t 且a E 應用上,像是網路的錯誤偵測、網站搜尋的紀錄、 1 1 2 2 n n 1 2 n i 氣象的監測等,使用者往往需要立即知道目前資料 (1in) ,E 為所有事件的集合。 分析的結果,若是利用傳統探勘頻繁情節的方法, 一個情節的發生 (occurrence) [3, 4, 6, 7]為此情 必須連同原始的序列資料重新探勘,因而無法提供 節的起始事件與終止事件發生的時間範圍 。對於某 即時的資訊。因此,在這篇論文中,我們提出一個 一情節的任兩個發生 O [t , s ]和 O [t , s ] ,若 1 1 1 2 2 2 方法,在資料串流的環境下,能夠只針對新增的資 t t 且 s s 或 t t 且 s s ,則對於此情節,O 1 2 1 2 1 2 1 2 1 料做探勘,以更新既有的頻繁情節,而不需要再掃 包含 O 。若情節 E的發生 O包含發生 O ,表示E 2

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档