- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对非方形区域无能为力
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * 恆星的分類 女性軍服的分群 一家銀行利用自動群集偵測技術,在其顧客資料倉儲中找出相似顧客的群集。 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 11/15 9/15 * 12/15 * * 決策樹方法的優點 產生易於了解的規則 可被轉換為簡明的英文或SQL語言,這是此技術最強大的力量 在規則導向領域的表現能力 決策樹在有規則可循的領域是個絕佳的選擇 節省分類時的計算時間 典型的測試包括數值比較、群組成員,以及簡單的連結,在電腦上使用時,這些測試轉換為簡單的布林與整數操作,相當快速且便宜 可處理連續性與類別性變項的能力 一個類別就是一個分支。連續性變數可以藉由選擇其數值範圍內的一個數字輕易的加以分類 明白的指出最佳變數的能力 根節點是用最好的分隔變數 * 決策樹方法的缺點 遇上太多類別時容易犯錯 發生於有許多層次或一個節點有許多分支的決策樹上。 計算上的訓練昂貴 建制及修剪決策樹的演算法必須重複計算且進行比對,這是費時費力的。 對非方形區域無能為力 大部分決策樹演算法一次只能檢查一個變數。這導致方型的分類區域,無法和決策空間中真實的資料分部妥善對應。 * 5. 類神經網路 類神經網路可以說是常見的Data Mining的技術,也許對某些人來說類神經網路就等於資料挖掘(Data Mining),它是為了應用在電腦科技上而產生的人腦簡化版本,在多數的應用中,它們可以從訓練資料組中學習,並產生歸類和預測的模型。類神經網路也可以透過自我組織圖(SOMs, self-organizing maps)和相關結構,以運用在非監督式資料挖掘(Data Mining)和時間序列分析。類神經網路的新的應用和結構正快速增加。 類神經網路的優勢在於它們的廣泛應用度。因為它們有著眾多軟體製造商的大量應用軟體和工具支援,類神經網路和人類思考過程的相似,使得它們在尋找模型上相當耐人尋味。 類神經網路有兩大缺點:其一是它們產生出來的模型難以理解-而這項缺點在各種軟體問市之後己漸漸被克服。其二是它們對資料的形式過度敏感-資料的形式不同,結果可能會天差地遠;所以,如何清理資料成使用上的最大障礙。 * 神經元 (Neuron) 細胞核 (輸出) (輸入) 神經鍵(Weights) * 類神經元 (Artificial Neuron) W1 I1 W2 I2 Wn In 輸入(Inputs) 輸出(Output) xT ? Y * 類神經網路(Artificial Neural Networks) Input 1 Input 2 Input 3 Input N Output * 動物辨識 人腦 眼睛看 形狀 大小 輪廓 速度 * 銀行信用貸款實例 借款人每月收入 借款人每月房屋貸款須付金額 借款人每月汽車貸款須付金額 借款人每月其他支出 是否合乎借款條件 輸入 (Inputs) 輸出 (Output) * 6.連結分析 連結分析可以搜尋資料之間的關聯並且據此發展出分析模型,這是圖像理論在資料挖掘(Data Mining)中的應用,消費者之間的關係越來越重要,比如說市場行銷機構就相當重視單一消費者、家庭消費者和企業消費者而不只是特定的紀錄。在地理區上的應用是電訊業,每一通電話都必須有兩方,這樣的資訊可以使一個市場行銷活動相當成功,例如MCI公司的「朋友與家庭」計畫。 然而,在資料挖掘(Data Mining)上,連結分析能得到關聯資料庫的幫助卻很少,它的最大使用者是執法單位,連結分析能將各種線索串聯起來破案,連結分析軟體在市面上少見,而且多著眼於關聯的視覺化而非分析關聯分析,運用連結分析表示著有著寫不完的程式碼。 * 7.Rough Set (約略集合) 約略集合理論﹙Rough Set Theory, RST) 是由波蘭籍 Pawlaky在1982年提出,用來處理模糊和不精確資訊的問題,此方法不需要對資料及有先驗或是額外的資訊,例如:機率分布或是模糊理論的歸屬函數。 RST可以在數據集合當中做知識探勘,進而產生決策法則知識。亦即RST可以用來(1)做屬性化簡(2)找到資料的隱藏樣式(3)產生決策法則。 * RST在資料前處理上首需產生決策表 (decision table) 或資訊表 (information table),用以表示資料的組成;其次需定義資料所在之「上界」 (upper ap
文档评论(0)