- 2
- 0
- 约 71页
- 2015-10-03 发布于北京
- 举报
Part II 資料採掘技術篇第六章 資料採掘介紹6.1 資料採掘概述6.2 資料採掘分類6.3 資料採掘系統6.4 資料預先處理6.5 資料採掘與資料倉儲6.6 資料採掘的應用和發展趨勢習題 資料採掘和資料倉儲作為決策支援新技術在近十年 來得到了迅速的發展。在過去的數十年中,我們產 生和收集了大量的資料,希望電腦自動智慧地分析 資料庫中的大量資料以獲取訊,是資料採掘產生並 發展的強大動力。 6.1 資料採掘概述 資料庫中的知識發現(Knowledge discovery in database,KDD)是一個從資料庫中採掘有效的、新 穎的、潛在有用的和最終可了解的模式的複雜程 序。 在KDD定義中: 資料是一組事實的集合,它可以來自不同的資料來源,可以是規則資料,也可以是非規則資料。 模式是關於資料子集的某種語言描述的表達式或某種可應用的模型,又稱為知識。 模式必須是有效的、新穎的、潛在有用的和最終可了解的,分別用可信度、新穎度、可用度和簡單度對其進行評估。 KDD程序是一個複雜程序,其步驟如圖6.1所示。 研究問題欄。包括掌握應預先了解的有關知識和確定資料採掘任務。 選擇目標資料集。根據上一步驟的要求選擇要進行採掘的資料。 資料預先處理。將上一步驟的資料進行整合、淨化、變換等,便資料變成可以直接應用資料採掘工具進行採掘的高品質資料。
原创力文档

文档评论(0)