空气污染监控资料之序列群组探勘.pdfVIP

  • 1
  • 0
  • 约2.12万字
  • 约 8页
  • 2018-08-04 发布于湖北
  • 举报
空气污染监控资料之序列群组探勘

空氣污染監控資料之序列群組探勘 Clustering Sequences of Air Pollution Surveillance Data 楊金龍 林奕森 郭煌政 國立嘉義大學資訊工程學系 摘要 events caused by a factory is the object in mining. 在空氣污染的防冶上,雖然工廠的生產 We propose three types of similarity between two 類別、煙囪高度、年生產量等等資料與工廠 sequences: (1) kinds of air pollution events, (2) 所可能造成之空污有關係,但是不如直接利 用環保單位對工廠排放廢氣之監控資料,加 period of event occurrence, (3) longest common 以探勘,以便擬定防治方針。有相似廢氣排 subsequence. 放之工廠應採用相似之監控程序,因此,本 A feature vector is derived from a cluster of 文針對空氣污染監控資料序列的資料型態 factories. Each cluster has its own control strategy 進行分群組探勘,做為空污防治之依據。 according to its feature. When the data of a factory 群組化是把資料依其資料內容的相似 is newly added to the database, the factory is 度分成多個群組,群組內的資料相似度要最 compared with the clusters to determine which 大,群組之間的相似度要最小。我們提出了 cluster the factory is most similar to. A control 三種能將含有時間間隔的有序序列有效分 strategy set up for the cluster of factories can be 類的相似度計算方法:1.事件發生種類相似 then applied to the factory. 度、2.事件發生週期相似度、3.基於相同序 列長度的相似度,在計算出相似度後再利用 1 、序論 階層式的群組方法進行群組化。 1.1 研究背景 在新加入的資料的比對上,除了可以使 在電腦科技和網路的日益進步,資料的 用所提出的群組化演算法進行外,使用特徵 取得漸趨便易,再加資料庫系統己被普遍的 資料來比對新加入的資料,如此只需找出和 使用,各種資料和資訊可以被輕易的儲存下 那一群集的特徵資料較相似,便可以進行快 來,因此如何利用所收集和存放的資料成為 速的比對,以省去執行演算法的時間花費。 一項重要的議題。資料探勘技術便是一種用 來找出資料間所隱藏的模式,使用者可以利 Some fundamental data items of a factory, 用資料探勘的技術搭配資料庫或資料倉儲 such as type of product, height of chimney, and 中所存放的大量資料,有效率的找出資料間 production capacity, are related to the air pollution 有用的資訊。 高度資訊化的今天,資料的種類已越來 it emitted. However, continuous surveillant data of

文档评论(0)

1亿VIP精品文档

相关文档