整合决策树与关连规则之资料挖矿架构及其实证研究.ppt

整合决策树与关连规则之资料挖矿架构及其实证研究.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
整合决策树与关连规则之资料挖矿架构及其实证研究.ppt

建構整合決策樹與關連規則之資料挖礦架構及實證研究 期末報告組別:三 資四B 謝殿臣 資四B 黃孝慈 資四B 顏姿青 一、緒論_研究背景及重要性 隨著資訊科技的進步,企業所記錄或儲存的大量資料,對於不同階層的使用者來,資料代表著不同的意義與價值。 當大量的資料被企業儲存起來,如何發揮與創造出資料價值變成為將資料由負債轉換資產的成功關鍵。 一、緒論_研究背景及重要性 一、緒論_研究目的 目的:事故排除 方法: 建構整合決策樹與關連規則之資料挖礦架構及實證研究。 實驗對象: 以台灣電力公司與某半導體廠兩個不同產業之案例做為實證,已檢驗此資料挖礦架構之效度。 一、緒論_論文結構與研究流程 1.2圖研究流程 二、文獻探討_知識發現與資料挖礦 表2.2 資料挖礦的定義 2.2圖 資料挖礦的四個循環 二、文獻探討_知識發現與資料挖礦 2.3圖 資料挖礦過程的主要步驟 二、文獻探討_知識發現與資料挖礦 2.4圖 資料挖礦專案流程步驟 2.5圖 適用各產業之資料挖礦架構 二、文獻探討_資料挖礦模式與工具 資料挖礦模式(Model)的六種形式 二、文獻探討_資料挖礦模式與工具 2.6圖資料挖礦的技術 二、文獻探討_資料挖礦挖掘結果類型 資料挖礦所處理的問題類型 由上而下:利用現有的模型來建立資料,藉此來描述某一特定變數。 由下而上:不需要特別標註在某一變數或某一種値,而是試著尋找所有變數中是否有隱藏某種關係。 二、文獻探討_資料挖礦工具 資料挖礦 屬於探索導向,不需事先假設以求驗證。 挖礦者需在一開始就釐清處理的工作目的為何? 資料挖礦工具 依照解決的問題類型與挖礦的目的而異。 通常不會只使用單一工具來進行挖掘工作。 二、文獻探討_資料挖礦工具 表2.3 挖礦問題類型及可使用的工具 (附註:ˇ表工具可使用之挖掘問題類型) 二、文獻探討_資料挖礦工具 表2.4 資料挖掘工具的基本特性 介紹的演算法如下: 遺傳演算法 類神經網路 Fuzzy Logic 記憶基礎理解 決策樹。 使用14種特性作介紹。 二、文獻探討_資料挖礦工具 表2.5資料挖礦工具間的比較 (附註:ˇ表資料挖礦工具能表現的能力) 二、文獻探討_關聯規則 是最常被應用的模式之一 關聯規則分析(association Rule Analysis) 從資料庫龐大的資料中,探索資料間欄位有趣的關係或相關性。 購物籃分析 如何從日積月累的交易資料中,以有效的方法找出商品間的關聯性,進而推斷消費者購買行為,創造無限商機。 二、文獻探討_關聯規則定義與說明 進行關聯規則挖礦時,作業流程的兩大步驟 找出所有的高頻項目組(Frequent Itemsets) 高頻項目組所出現的次數必須大於等於事先定義的最小支持度數目。 此步驟決定了整體作業的效能 從找到高頻項目組產生關聯規則 所產生的規則必須滿足決策者所給定支持度與信賴度的最低門檻値,規則才成立。 二、文獻探討_關聯規則定義與說明 定義描述 二、文獻探討_關聯規則定義與說明 關聯規則的成立 必須滿足決策者所訂定之最小支持度(Minmum Support Threshold),和最小信賴度(Minmum Confidence Threshold)。 有意義的關聯規則 其支持度與信賴度必須大於或等於所訂定之最小門檻値。 增益指標 加入後,若增益大於1,則表示規則的預測結果比單純的亂數還要好,反之,則較差。 二、文獻探討_關聯規則定義與說明 若規則表示為X=Y,則 1.支持度(Support) 在規則(Rule)中,項目(Items)一起出現的交易暨路佔全部交易紀錄的百分比。 最小支持度控制了一個關聯規則必須涵蓋的最少資料數目,以篩選掉不顯著的規則,在實務上才有應用價値。 支持度代表的意義為X與Y一起出現的機率。 二、文獻探討_關聯規則定義與說明 若規則表示為X=Y,則 2.信賴度(Confidence) 代表此條規則的預測強度。 X發生之下發生Y結果的機率足以使得此關聯規則得以成立。 計算在前提項目X發生的情況下,發生結果Y的機率。 二、文獻探討_關聯規則定義與說明 若規則表示為X=Y,則 3.增益(Lift or Improvement) 比較信賴度與結果項目Y單獨發生時之機率兩者間的大小。 關聯規則的條件機率比母體中原本發生的機率大才具有意義。 二、文獻探討_關聯規則類型 關聯規則類型 1.以屬性質的形態為基礎 若挖礦規則焦點放在項目(Item)是否出現,則稱為布林値的關聯規則(Boolean Association Rule) 。 2.以規則中涵蓋資料維度為基礎 若要挖礦的規則的項

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档