- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
spss data mining 旗舰 - 世新大学
Copyright 2003-12, SPSS Taiwan Corp. Agenda 資料採礦的秘辛 資料採礦觀念介紹 資料採礦到底是什麼?為什麼要做資料採礦? Data Mining 和統計及OLAP有什麼不同? Data Mining 和 Data Warehousing 的關係 Data Mining 的方法與特徵 怎麼做好Data Mining? 何謂CRISP-DM? Agenda Clementine中文版功能介紹 Clementine的工作環境及其方便容易的操作 對應CRISP-DM,Clementine有哪些功能 Clementine 在商業理解階段提供的功能 Clementine 在資料理解階段提供的功能 Clementine 在資料預備階段提供的功能 Clementine 在塑模階段提供的功能 Clementine 在評估階段提供的功能 Clementine 在部署階段提供的功能 Data Mining 是什麼? Data Mining是從資料中找出有用珍貴知識的一個過程 為什麼要做 Data Mining? 競爭日益劇烈,了解客戶需求才能佔有優勢 過去及現在和客戶互動方式的改變 Data Mining 和統計不同? Data Mining 沒有事先假設 多數狀況下母體參數已知 資料量越大越好,小資料也可以挖只是較不可靠 融合各種知識,包括統計、Machine Learning、人工智慧、基因等 Data Mining 和 OLAP 不同? Data Mining 和資料倉儲的關係 何謂資料倉儲 (Data Warehousing)? 將現有資料、歷史資料、外部資料等經過有系統的整合,把資料選取、分類、轉換達到最佳化後,融入一個設計好的關連式資料庫中,以利資料分析者存取,大量改進效率。 Data Mining 及 OLAP 都是由資料倉儲中取出資料分析 Data Mining 的方法 Classification Clustering Estimation Prediction Market Basket Analysis Description Data Mining 的其他特徵 Interactive 互動性 Automation 電腦自動化 Continuing 連續性,是動態的 團隊分工合作 具有決策功能,使企業組織創新、再造 目標:一對一 怎樣才能做好 Data Mining Process 符合 Data Mining 的程序,如 CRISP-DM CRISP-DM 標準流程 Cross-Industry Standard Process for Data Mining SPSS 和 NCR 在 1996 年為克萊斯勒做資料採礦時訂出的一套標準程序,並參加了專家意見修訂,目前版本為1.0 1. Business Understanding 了解企業方針及要解決的問題何在 訂定 Data Mining 計畫 2. Data Understanding 收集初步資料 簡單了解資料 確認資料品質 3. Data Preparation 資料清理、整合 格式設定,為下一步建立模型做準備 4. Modeling 選定要建立的模型 用上一步驟的資料建立模型並測試 5. Evaluation 評估模型及回顧整個過程 決定是否進入下一階段 6. Deployment 計畫要怎麼部署 監控部署過程 產出報告並檢討 CRISP-DM 流程圖 以資料為中心 不斷循環 不是從頭做到尾,有需要時可以往回 Clementine 中文版 現代淘金者 的最佳資料採礦工具 工作環境—完全中文化 工作環境—介面介紹 工作環境—專案管理 一個專案可以包括多個串流、圖表、各種外部檔案,全部可以利用右下角的專案管理員整理起來。 優點:不用每次都去找要用的檔案跟相關串流,直接開啟專案,所有相關物件都會出現在專案管理員中。 工作環境—配合CRISP-DM流程 可將各種檔案及流程圖分門別類整理在六個CRISP-DM步驟的資料夾中,方便任何使用人員隨時存取。 很清楚所做過的流程,有架構不紊亂。即使非原始的建立者也可以迅速進入狀況。 也可依自己需求增減資料夾 工作環境—管理員 Clementine會自動將所有流程放在「串列」區,跑出的圖表放在「輸出」區,建立的模型則放在「模型」區,隨時可以點選不用重跑一遍。且這些結果都可儲存保留。 工作環境—用串流方式呈現 上使用者在工作區自由發揮,利用豐富的工具,設計出最符合實際需要的流程。彈性大、自由度高。 工作環境— Windows 作業環境 配合基本的windows功能如剪貼、滑鼠拖曳、右鍵功能表、鍵盤快速鍵直接操作等,讓熟悉windows的使用者可以馬上上手。 基本功能—自動配置 基本功能—
您可能关注的文档
- rectangular form (直角座标).ppt
- research of defogging base on wavelet transforms 基于小波变换的 .pdf
- review on studies on mechanical properties of sgp sgp的力学 .pdf
- rfid 行动校园定位导览服务系统 - npu csie - 最新消息.pdf
- rfid case study – boeing solution.ppt
- rfm指标と顾客生涯似值:阶层ベイズモデルを使った 非契约 - terrapub.pdf
- rj-45网路线制作.ppt
- rhegf在食管黏膜损伤部位对mscs招募及定居 - 第三军医大学学报.doc
- rk平台系统相关改动.doc
- rtk算法问答卷 - 湖南北云科技有限公司.doc
- 2024年03月浙江金华义乌市公安局招考聘用184名警务辅助人员笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 2024年03月河北省科学技术厅事业单位选聘工作人员笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 2024年10月贵州兴仁市委政法委公开招聘青年见习人员笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 2024年03月民政部所属事业单位2024年度公开招考31名应届毕业生笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 2024年03月广东肇庆封开县教育系统赴高校招考聘用教师64人笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- [重庆]2025年重庆忠县教育事业单位招聘62人笔试历年参考题库附带答案详解.doc
- 【兵团】2024年新疆生产建设兵团第七师胡杨河市第七师医院医共体招聘工作人员133人笔试历年典型考题及考点剖析附带答案详解.docx
- 2024年10月北京高校大学生就业创业指导中心公开招聘3人笔试历年典型考题(历年真题考点)解题思路附带答案详解.docx
- 【南阳】2024年河南南阳市方城县招才引智事业单位招聘工作人员2人笔试历年典型考题及考点剖析附带答案详解.docx
- 【枣庄】2024年山东枣庄市台儿庄区青年人才优选20人笔试历年典型考题及考点剖析附带答案详解.docx
文档评论(0)