- 1、本文档共113页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
资讯管理课程
* 資料探勘課程---李淑芬老師 * A Five-Step Approach for Unsupervised Clustering —Cont. 接著會看到建立好的 8 個群集,表示資料探勘完成,會詢問你是否產生報表,按 No,因為依經驗法則,多於 5、6 群的非監督式分群可能不是最佳結果。 然後出現『Dataset not mined』的視窗,按確定。 重複先前的步驟,這次將相似度改為 55,容限值仍是 1.0,則mining出的結果為 3 群,則按確定產生報表。 經 1 至 2 分鐘後,出現圖4.6 RuleMaker 選項的視窗畫面,可設定也可直接跳過。將畫面中 Minimum rule coverage設定為 30,其餘參數值採預設值,按確定,則出現結果如圖4.7。 * 資料探勘課程---李淑芬老師 * A Five-Step Approach for Unsupervised Clustering —Cont. Step3:解釋摘要結果 (工作表:Sheet1 RES SUM) * 資料探勘課程---李淑芬老師 * A Five-Step Approach for Unsupervised Clustering —Cont. =(最大類別平均值 - 最小平均值) / 資料標準差 可看出哪一類型屬性最適合來辨識各群集的屬性 * 資料探勘課程---李淑芬老師 * A Five-Step Approach for Unsupervised Clustering —Cont. Step4:針對每一群集解釋其結果,以Class 3摘要結果來說明 (Sheet1 RES CLS) Typicality:代表值,是一筆資料與其所屬類別中 其他成員的平均相似度。 Predictability:可預測性,指在某類別中,某屬性值 佔了多少比例,如 0.57表示在 Class 3 中,有57% 的比例屬性值是 30-40K。 Predictiveness:預測度,指一筆資料範例屬性A的值 為 vi 的情況下,該筆資料範例屬於 類別C 的機率,如預測度 1.00 表示 年收入50-60K的資料都落在Class 3中 ,因此50-60K 為Class 3的充要條件。 *如一個屬性值可預測性和預測度皆為1.0,表示 該類別中所有資料都具有該屬性值,且此屬性值的 資料都在該類別中,因此此屬性值為該類別的必要 且充要成員。 *如一個屬性值預測度為1.0,而可預測性小於1.0, 表示此屬性值的資料都在該類別中,則此屬性值 為該類別的充要但非必要成員。 * 如一個屬性值可預測性為1.0,而預測度小於1.0, 表示該類別中所有資料都具有該屬性值,則此屬 性值為該類別的必要但非充要成員。 * 資料探勘課程---李淑芬老師 * A Five-Step Approach for Unsupervised Clustering —Cont. Step5:顯示每一群集與定義其解釋規則 (Sheet1 RES RUL) * 資料探勘課程---李淑芬老師 * A Six-Step Approach for Supervised Learning 使用ESX 做監督式學習的六個步驟: Step1:將欲探勘的原始資料載入 Excel 中,並選擇一個輸入屬性。 Step2:執行資料探勘 Step3:讀取與解釋總結果 Step4:讀取與解釋測試集結果 Step5:讀取與解釋個別類別的結果 Step6:視覺化瀏覽與解釋類別規則 以表4.1 信用卡促銷資料為範例來說明。 * 資料探勘課程---李淑芬老師 * A Six-Step Approach for Supervised Learning —Cont. Step1:將欲探勘的原始資料載入 Excel 中,並選擇一個輸入屬性。 輸入屬性:收入範圍、信用卡保險、性別、與年齡。 * 資料探勘課程---李淑芬老師 * A Six-Step Approach for Supervised Learning —Cont. Step2:執行資料探勘 執行 iDA 功能表中 Begin Mining Session 選項,當出現註冊視窗時,輸入使用者名稱,公司名稱則輸入 student。而註冊碼於安裝的光碟中。(只有第一次使用 iDA 才需要註冊) 接著會出
您可能关注的文档
- 贸易保护、演化博奕与福利分析.pdf
- 贵州省科技文献平台信息资源 - 黔东南州科技局.ppt
- 贸易保护、演化博弈与福利分析.doc
- 贾生华 - 浙江大学房地产研究中心.doc
- 资产组合(多期限、多种类)绩效评价 - 湖南大学.doc
- 资料a凸显了什么公共卫生的风险.ppt
- 贵州茅台结构分析.ppt
- 资本市场法律热点问题 - 君合.pdf
- 资本市场主要股权融资工具.ppt
- 资源供应国、生产国与消费国企业之间的交流不畅 - illegal logging .ppt
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
文档评论(0)