Chapter 6.資料採擷簡介.pptVIP

  • 2
  • 0
  • 约 71页
  • 2015-10-03 发布于北京
  • 举报
Part II 資料採掘技術篇 第六章 資料採掘介紹 6.1 資料採掘概述 6.2 資料採掘分類 6.3 資料採掘系統 6.4 資料預先處理 6.5 資料採掘與資料倉儲 6.6 資料採掘的應用和發展趨勢 習題 資料採掘和資料倉儲作為決策支援新技術在近十年 來得到了迅速的發展。在過去的數十年中,我們產 生和收集了大量的資料,希望電腦自動智慧地分析 資料庫中的大量資料以獲取訊,是資料採掘產生並 發展的強大動力。 6.1 資料採掘概述 資料庫中的知識發現(Knowledge discovery in database,KDD)是一個從資料庫中採掘有效的、新 穎的、潛在有用的和最終可了解的模式的複雜程 序。 在KDD定義中: 資料是一組事實的集合,它可以來自不同的資料來源,可以是規則資料,也可以是非規則資料。 模式是關於資料子集的某種語言描述的表達式或某種可應用的模型,又稱為知識。 模式必須是有效的、新穎的、潛在有用的和最終可了解的,分別用可信度、新穎度、可用度和簡單度對其進行評估。 KDD程序是一個複雜程序,其步驟如圖6.1所示。 研究問題欄。包括掌握應預先了解的有關知識和確定資料採掘任務。 選擇目標資料集。根據上一步驟的要求選擇要進行採掘的資料。 資料預先處理。將上一步驟的資料進行整合、淨化、變換等,便資料變成可以直接應用資料採掘工具進行採掘的高品質資料。

文档评论(0)

1亿VIP精品文档

相关文档