第12組.docVIP

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第12組

◎資料採礦(Data Mining)連載之一 ?何謂DATA MINING ?DATA MINING和統計分析的不同 ?為什麼需要DATA MINING 何謂DATA MINING? 資料採礦的工作(Data Mining)是近年來資料庫應用領域中,相當熱門的議題。它是個神奇又時髦的技術,但卻也不是什麼新東西,因為Data Mining使用的分析方法,如預測模型(迴歸、時間數列)、資料庫分割(Database Segmentation)、連接分析(Link Analysis)、偏差偵測(Deviation Detection)等; 美國政府從第二次世界大戰前,就在人口普查以及軍事方面使用這些技術,但是資訊科技的進展超乎想像,新工具的出現,例如關連式資料庫、物件導向資料庫、柔性計算理論(包括Neural network、Fuzzy theory、Genetic Algorithms、Rough Set等)、人工智慧的應用(如知識工程、專家系統),以及網路通訊技術的發展,使從資料堆中挖掘寶藏,常常能超越歸納範圍的關係;使Data Mining成為企業智慧的一部份。 Data Mining是一個浮現中的新領域。在範圍和定義上、推理和期望上有一些不同。挖掘的資訊和知識從巨大的資料庫而來,它被許多研究者在資料庫系統和機器學習(Machine learning)當作關鍵研究議題,而且也被企業體當作主要利基的重要所在。有許多不同領域的專家,對Data Mining展現出極大興趣,例如在資訊服務業中,浮現一些應用,如在Internet之資料倉儲和線上服務,並且增加企業的許多生機。 隨著資訊科技的進步以及電子化時代的來臨,現今企業所面對的是一個與以往截然不同的競爭環境。在資訊科技的推波助瀾下,不僅企業競爭的強度與速度倍數於以往,激增的市場交易也使得各企業所需儲存與處理的資料量越來越龐大。 在這種情況下,企業的焦點已從以往的資料整理與蒐集,轉變成如何有效的利用資料庫來進行資訊的獲取。換言之,企業如何因應外界的競爭,能快速且有效的從資料庫中取得有用的資訊,並反應市場或消費者的需求,成為各企業重視的焦點。資料採礦(data mining)所要處理的問題,就是在龐大的資料庫中尋找出有價值的隱藏事件,並且加以分析。而其主要的貢獻在於,它能從資料庫中獲取有意義的資訊以及對資料歸納出有結構的模式,以作為企業在進行決策時之參考依據(Carven and Shavlik, 1997)。此外,資料採礦所著重的是資料庫的再分析,包括模式的建構或是資料樣式的決定,其主要目的是用以發現資料庫擁有者先前關心卻未曾知悉的有價值資訊(Hand, 1998)。事實上,資料採礦並不只是一種技術或是一套軟體,而是一種結合數種專業技術的應用。 Data Mining是指找尋隱藏在資料中的訊息,如趨勢(Trend)、特徵(Pattern)及相關性(Relationship)的過程,也就是從資料中發掘資訊或知識(有人稱為Knowledge Discovery in Databases, KDD),也有人稱為「資料考古學」(Data Archaeology)、「資料樣型分析」(Data Pattern Analysis)或「功能相依分析」(Functional Dependency Analysis),目前已被許多研究人員視為結合資料庫系統與機器學習技術的重要領域,許多產業界人士也認為此領域是一項增加各企業潛能的重要指標。 此領域蓬勃發展的原因:現代的企業體經常蒐集了大量資料,包括市場、客戶、供應商、競爭對手以及未來趨勢等重要資訊,但是資訊超載與無結構化,使得企業決策單位無法有效利用現存的資訊,甚至使決策行為產生混亂與誤用。如果能透過資料採礦技術,從巨量的資料庫中,採礦出不同的資訊與知識出來,作為決策支援之用,必能產生企業的競爭優勢。 Data Mining可說會合了以下六種領域: ●Database systems, Data Warehouses, OLAP ●Machine learning ●Statistical and data analysis methods ●Visualization ●Mathematical programming ●High performance computing Data mining 組成結構圖 Data Mining應用的行業包括了金融業、電信業、網路相關行業、零售商、直效行銷、製造業、醫療保健及製藥業等等,應用領域如下表: Applications of Data Mining Customer-focused Operations-focused Res

您可能关注的文档

文档评论(0)

75986597 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档