对非方形区域无能为力.PPT

下载文档 降价啦

0
0
约2.62万字
约 150页
2018-11-17 发布于天津
举报
版权申诉
保障服务

对非方形区域无能为力.PPT

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

对非方形区域无能为力

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * 恆星的分類女性軍服的分群一家銀行利用自動群集偵測技術，在其顧客資料倉儲中找出相似顧客的群集。 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 11/15 9/15 * 12/15 * * 決策樹方法的優點產生易於了解的規則可被轉換為簡明的英文或SQL語言，這是此技術最強大的力量在規則導向領域的表現能力決策樹在有規則可循的領域是個絕佳的選擇節省分類時的計算時間典型的測試包括數值比較、群組成員，以及簡單的連結，在電腦上使用時，這些測試轉換為簡單的布林與整數操作，相當快速且便宜可處理連續性與類別性變項的能力一個類別就是一個分支。連續性變數可以藉由選擇其數值範圍內的一個數字輕易的加以分類明白的指出最佳變數的能力根節點是用最好的分隔變數 * 決策樹方法的缺點遇上太多類別時容易犯錯發生於有許多層次或一個節點有許多分支的決策樹上。計算上的訓練昂貴建制及修剪決策樹的演算法必須重複計算且進行比對，這是費時費力的。對非方形區域無能為力大部分決策樹演算法一次只能檢查一個變數。這導致方型的分類區域，無法和決策空間中真實的資料分部妥善對應。 * 5. 類神經網路類神經網路可以說是常見的Data Mining的技術，也許對某些人來說類神經網路就等於資料挖掘(Data Mining)，它是為了應用在電腦科技上而產生的人腦簡化版本，在多數的應用中，它們可以從訓練資料組中學習，並產生歸類和預測的模型。類神經網路也可以透過自我組織圖（SOMs, self-organizing maps）和相關結構，以運用在非監督式資料挖掘(Data Mining)和時間序列分析。類神經網路的新的應用和結構正快速增加。類神經網路的優勢在於它們的廣泛應用度。因為它們有著眾多軟體製造商的大量應用軟體和工具支援，類神經網路和人類思考過程的相似，使得它們在尋找模型上相當耐人尋味。類神經網路有兩大缺點：其一是它們產生出來的模型難以理解－而這項缺點在各種軟體問市之後己漸漸被克服。其二是它們對資料的形式過度敏感－資料的形式不同，結果可能會天差地遠；所以，如何清理資料成使用上的最大障礙。 * 神經元 (Neuron) 細胞核 (輸出) (輸入) 神經鍵(Weights) * 類神經元 (Artificial Neuron) W1 I1 W2 I2 Wn In 輸入(Inputs) 輸出(Output) xT ? Y * 類神經網路(Artificial Neural Networks) Input 1 Input 2 Input 3 Input N Output * 動物辨識人腦眼睛看形狀大小輪廓速度 * 銀行信用貸款實例借款人每月收入借款人每月房屋貸款須付金額借款人每月汽車貸款須付金額借款人每月其他支出是否合乎借款條件輸入 (Inputs) 輸出 (Output) * 6.連結分析連結分析可以搜尋資料之間的關聯並且據此發展出分析模型，這是圖像理論在資料挖掘(Data Mining)中的應用，消費者之間的關係越來越重要，比如說市場行銷機構就相當重視單一消費者、家庭消費者和企業消費者而不只是特定的紀錄。在地理區上的應用是電訊業，每一通電話都必須有兩方，這樣的資訊可以使一個市場行銷活動相當成功，例如MCI公司的「朋友與家庭」計畫。然而，在資料挖掘(Data Mining)上，連結分析能得到關聯資料庫的幫助卻很少，它的最大使用者是執法單位，連結分析能將各種線索串聯起來破案，連結分析軟體在市面上少見，而且多著眼於關聯的視覺化而非分析關聯分析，運用連結分析表示著有著寫不完的程式碼。 * 7.Rough Set (約略集合) 約略集合理論﹙Rough Set Theory, RST) 是由波蘭籍 Pawlaky在1982年提出，用來處理模糊和不精確資訊的問題，此方法不需要對資料及有先驗或是額外的資訊，例如：機率分布或是模糊理論的歸屬函數。 RST可以在數據集合當中做知識探勘，進而產生決策法則知識。亦即RST可以用來（1）做屬性化簡（2）找到資料的隱藏樣式（3）產生決策法則。 * RST在資料前處理上首需產生決策表 (decision table) 或資訊表 (information table)，用以表示資料的組成；其次需定義資料所在之「上界」 (upper ap