我所知道的一点data mining - 电子邮件系统.docVIP

  • 3
  • 0
  • 约1.64万字
  • 约 30页
  • 2017-09-06 发布于天津
  • 举报

我所知道的一点data mining - 电子邮件系统.doc

我所知道的一点data mining - 电子邮件系统

◎我所知道的一點 Data Mining ? 1.前言 2.定義 3.方法 4.工具 5.應用 6.結論 Data mining (DM)是一個蠻當紅的專題。我們所面臨的第一個問題,便是不知道應該怎麼去翻譯這個名詞。硬譯為「資料挖掘」雖沒有大錯,但聽起來不夠高雅,也沒有學術的味道,連商業的氣味都不夠。一時之間因為實在想不出一個好詞,只好放下不談。 甚麼叫 DM ?關於定義,各人的說法不一。基本上,先給你一個大的 data set ──假設你可以讀它,下面的問題是:從這裡你可以得到甚麼? 極大部分──如果不是全部──的 data sets ,是已經存在的。時代不一樣了,現在數據來得既多又便宜,多到沒有人有時間去看的程度。這有一點像我們的醫療體系。早先的醫生要望聞問切,在少量的數據裡,設法組合出最好的治療方案。現在則是一個名醫,一上午要門診到一百五十個病人以上。他只能靠 algorithm 來看病:問一兩個問題,聽一兩個問題,然後開藥。這是 DM 的精神,並不是傳統的 data analysis 的精神。 ▲??TOP??? 定義 不同的人有不同的看法:比較樂觀的是 Berry and Linoff (1997) 的說法: ●分析報告給你後見之明 (hindsight) ●統計分析給你先機 (foresight) ●DM 給你識見 (insight) 這話說得太

文档评论(0)

1亿VIP精品文档

相关文档