- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
                        查看更多
                        
                    
                
                                                    專.題.論.述 2003 
                                                                  11 
資料挖掘                                    ●華銀資訊室 洪嘉興 
(Data Mining)淺析 
 前言 
    本篇文章想要寫給從來沒有接觸過資料挖掘(Data Mining)的人閱讀,運用 
 淺顯的例子來介紹資料挖掘(Data Mining)這門技術,如果您曾經短暫接觸過資 
 料挖掘(Data Mining)技術,本篇文章或許可以勾起您的一些記憶,但我會建議 
 去看專門探討資料挖掘(Data Mining)的書籍。 
 從探索火星到刑案偵查 
    二OO一年,美國太空總署發射火星奧德賽號( O d y s s e y )探測船,順利地從 
 佛羅里達州(Florida)的卡納維爾角(Cape Canaveral)發射昇空,奧德賽號探測 
 船的任務是掃瞄火星地表組成成份,並尋找水源及潛在輻射危險,以供未來人 
 類實際登陸探勘火星時的參考。 
    奧德賽號探測船傳回許多火星地表影像及數據資料,科學家們利用最新的 
 資訊科技分析這些照片,分析結果顯示火星的地表下埋藏了大量的冰,科學家 
 推論火星上有生命存在的可能性大大增加。 
    在台灣,二OO三年初,警政署刑事局完成建置「刑案知識庫」,運用資訊 
 技術整合司法院、法務部及警政署等機關之判決、執行、起訴及移送等刑案資 
 料、前科相片、在監在所、同囚會客、通緝、流氓、幫派、典當、出入境及車 
 籍等總計約五億筆的資料,提供警方在刑案發生後,僅掌握部分線索,如:地 
 緣關係、犯罪手法、嫌疑犯年齡、性別等,即可利用資料挖掘(Data Mining)、 
 全文檢索(Full Text Information Retrieval)及跨部門資料整合等資訊技術, 
 立即分析過去發生的刑案資料,將相關案件、可疑人犯、相片及其共犯結構, 
 在第一時間內,提供給偵辦刑案員警參考,成為警方打擊犯罪的輔助工具。 
     這兩件事情看似南轅北轍,其實有其關聯性,它們都是從所蒐集的龐大資 
                                                                  17 
2003 專.題.論.述 
 11 
           料中找尋有用的資料型態( P a t t e r n ),輔助人類決策判斷或提供候選名單,這樣 
           的資訊技術就叫做資料挖掘(Data Mining)。 
           資料挖掘的由來與定義 
               UsamaFayyad出生於突尼西亞,一九八七年就讀密西根大學時,參加通用汽 
           車公司的暑期工作,工作內容是從數以千萬計的維修記錄中找出規則,協助維修 
           人 員迅速發 現問題。 F a y y a d於是發 展出 一種稱為 樣型辨 識 ( P a t t e r n 
           R e c o g n i t i o n )演算法,不但成了他1 9 9 1年論文的主題,也衍生出後來資料挖掘 
           (Data Mining)的發展。 
               離開密西根大學後,F a y y a d加入美國太空總署的噴射推進實驗室,他的演算 
           法在太空探測、地質研究等工作上均展現了非常驚人的潛力,最後連美國軍方也 
           開始應用這樣的技術來增強雷達解讀與辨識資料的能力。 
               DataMining最早是被應用在天文學上,藉由統計、機器學習( M a c h i n e 
           L e a r n i n g )、類型辨識(PatternRecognition)等技術,在短短4小時內所發現的 
           行星勝過20多位天文學家4年的研究成果。 
               資料挖掘是一種「從龐大資料或大型資料庫中由電腦自動選取一些重要的、 
           潛在有用的資料類型或知識的過程」。簡單的說,就是一套電腦系統,日以繼夜 
           地在數量龐大的資料中找出使用者有興趣的資料類型。 
               有關資料挖掘的研究蓬勃發展,結合了統計學、人工智慧、資料庫、領域知 
           識(DomainKnow-
                
原创力文档
                        

文档评论(0)