- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
click the “start” button 產生預測結果 點選右鍵中的“Visualize classifier errors”,將彈出一個新視窗顯示一些有關預測誤差的散點圖 從圖中按 Save button 存成self-test-predicted.arff 使用ultraEdit打開self-test-predicted.arff,會看到增加“Instance_number” and “predictedresults”兩個屬性,這個屬性上的值就是模型對每個實例的預測值。 預測模型 補習與否 國小成績 有無使用參考書 有無兄長可指導 在家研讀數學時數 寫回家功課狀況 預測 國中數學 成績 未來努力方向 國小成績部份應使用『新生入學考試』成績為依據,且試題應該有九年一貫能力指標為依據命題,且試卷成績可以建立常模方為有效試題,以提高研究之信效度。 國中成績部份應採用多次段考成績為依據且應經過標準化處理,例如將成績轉化為z分數,再決定成績等級。 問卷設計內容要謹慎小心,否則入寶山也挖不到金礦,也就是要小心『屬性』的良窳。 本次報告主要是希望透過實作來瞭解weka操作與DM的神奇,並非一份完善的研究報告,敬請見諒 5 7 2 3 8 7 6 5 3 1 + 4 1 1 9 1 5 6 7 + 5 + 7 2 3 8 7 6 5 3 1 + 4 1 1 3-2+1=? 分類法在數學科學習成就上的應用與實作 指導教授:鄭滄祥 學 生:陳貝逢 日 期:99年1月9日 研究背景與動機 數學課是大多數學生學習成就低落的一門學科,學習成就低落與學習態度、方法、環境之間必定有某種程度的關係。 好的學習成效必定有好的學習態度、方法及環境。缺了一項,就可能會造成之後學習上的瓶頸。與其事後進行補救,更好的方法是事先找出問題所在,以加強學習者的自我認知。 研究背景與動機 本研究針對「安平國中一年級學生數學科學習態度自我評量」的問卷結果作分析,是利用資料探勘中的分類分析(Classification Analysis)方法,找出一組能夠描述資料集合特徵的模式,以期能預測學生從國小升上國中後的數學學習成效,能夠對於學生進行分類,加強教學成效,幫助學習。 研究目的 探討不同性別的學生在數學科目上的學習成效是否有顯著差異。 探討不同的學習態度、時間、環境在數學科目上的學習成效是否有顯著差異。 找出學習者的學習障礙與迷思。供教師在日後教學時,能針對個別或大部分的學生來進行補救教學。 研究流程 研究方法 本研究針對「安平國中數學科學習態度自我評量」的問卷結果作分析 問卷題目代表的變數及意義如下 id 學生姓名 sex 性別(female|male) elementary score 國小數學成績 upbringing 是否在外參加補習(yes or no ) review hour 每日回家複習數學的時間(0,1,2,3) reference book 是否有購置參考書(yes or no ) senior 是否有哥哥或姐姐可教導(yes or no ) homework 回家是否按時寫作業(yes or no ) learning attitude 學習的態度是否認真(yes or no ) results 上國中後的數學成績(highest,high,middle,low) 研究方法 自1960 年代開始,已有許多學者使用樹狀結構來進行資料分析,包括AID、ID3、CHAID、FACT 等,其中,決策樹是應用廣泛的分類與預測工具。決策樹是以樹狀圖為基礎的方法,和類神經網路最大不同處,在於決策樹可產生出規則,讓使用者容易理解。目前最普遍使用的決策樹有兩種-C4.5(Quinlan, 1993)及CART(Breiman et al., 1984),主要的差別在於前者是多元樹,而後者是二元樹,亦即每一節點皆只有兩個分支。本研究視資料尺度類型,採C4.5 進行研究。 C4.5決策樹 C4.5 決策樹歸納法是由其前身ID3 學習法(Quinlan, 1986)改進而來(Quinlan, 1979)。ID3 為一決策樹歸納技術,在構建決策樹過程中,ID3 以資訊獲利(Information Gain)為基準,選擇最佳的屬性當成決策樹的節點,使得所導致的決策樹為一最簡單(或接近最簡單)的決策樹。 實作 收集資料 使用軟體工具(WEKA) 資料轉檔.csv - .arff 輸入java weka.core.converters.CSVLoader self-test.csv self-test.arff 即可完成轉換。 資料轉檔.csv - .arff weka explorer-Open
文档评论(0)