- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用WEKA平台提升数据挖掘课程教学效果
摘要:目前,数据挖掘原理与算法这门课在教学中主要以讲授经典的算法和理论为主,枯燥的算法分析和理论介绍很难引起学生的兴趣,而吸引学生并让他们体验到实践效果对完成教学目标尤为重要。本文讨论了以挖掘软件WEKA为平台进行教学的思路。
关键词:WEKA平台;数据挖掘课程;教学效果
中图分类号:G642.41 文献标志码:A 文章编号:1674-9324(2014)52-0158-02
一、引言
数据挖掘是将隐含的,尚不为人所知的,同时又是潜在有用的信息从数据中提取出来,建立计算机程序,自动在数据库中搜索,已发现规律或者模式[1]。很多高校,包括世界上的一些著名高校都开设了数据挖掘课程。课程基础理论部分,一般包括数据预处理、关联规则、分类、聚类、时间序列挖掘、web挖掘等内容,通过该课程的学习使学生学会分析研究挖掘中数据预处理、常用算法、结果的可视化等,并培养学生的数据抽象能力,提高学生的专业素质,为学生毕业后从事有关的工作打下一个良好的基础[2]。数据挖掘是多学科交叉而产生的一门新技术,涉及的知识面很多,现在教材上主要介绍的都是一些经典的算法和理论,比较枯燥,很难引起学生的兴趣。数据挖掘从一开始就是应用性的科学,它有很强的实验性,因此,在数据挖掘实验中选择合适的数据挖掘软件非常重要[3]。商用的数据挖掘软件很多,怀卡托大学的Weka小组荣获了数据挖掘和知识探索领域的最高服务奖,Weka系统得到了广泛的认可,被誉为数据挖掘和机器学习历史上的里程碑。因此,我们将Weka引入到数据挖掘的课堂教学实践中。首先,是任课教师在讲授经典算法的同时,通过Weka的可视化界面展示经典算法和实例的运行效果;也可以应用WEKA的多种算法对某一实例进行对比演示,在课程作业环节,为学生布置了一些现实应用,并要求他们借助WEKA自己解决[4]。这样,学生通过Weka平台可以看到经典算法实现的效果,也可以自己动手完成作业,有能力的同学还可以通过Weka软件实现自己的算法,或者是对现有算法的改进实现。让枯燥变得有趣,让抽象变成实现,引导学生了解数据挖掘课程的作用,培养他们利用所学知识解决实际问题的动手能力和发现问题、解决问题、评估问题的研究能力[4]。
二、Weka简介
Weka是由新西兰怀卡托大学开发的,是怀卡托智能分析系统的缩写。Weka用Java写成,并且限制在GUN通用公证书的条件下发布。它可运行于几乎所有的操作平台,包括Linux,Windows,Macintosh操作系统。Weka工作平台能处理所有标准数据挖掘问题的方法:回归、分类、聚类、关联规则挖掘及属性选择。WEKA要求的数据形式必须是ARFF格式,CSV格式,C4.5格式。WEKA存储数据的格式是ARFF文件,这是一种ASCII文本文件,表格里的行称作一个实例Instance,一个列称作一个属性Attribute。这样的表格呈现了属性之间的一种关系。
Weka的使用方式之一是将一种学习方法应用于一个数据集,然后分析其输出,从而更多地了解这些数据。另一种方式,则是使用已学到的模型对新实例做出预测。第三种方式是应用几种不同的学习器,根据他们的性能表现选择其中的一种来做预测。Weka中最有价值的部分是真实学习方案的实现。其次,当属数据预处理工具也就是过滤器。当用户运行Weka后,必须从如下四种不同的用户界面中做出选择:探索者、知识流、实验者和命令界面。使用Weka最简单的方法,是通过称作探索者(explorer)的图形界面,通过这个用户界面,所有weka功能都可以由菜单选择及表单填写的方式完成。知识流界面(Knowledge Flow),使用户能知道自己如何处理流动中的数据。知识流允许用户在屏幕上任意拖动代表学习算法和数据源的方框,并将他们结合在一起设置。实验者界面是专门设计来帮助用户在实际应用中将不同的学习技术进行比较,因为它能使具有不同参数设定的分类器和过滤器在运行一组数据时更加容易,收集性能统计数据及实现显著性测试时更加简便。Weka可由以下网址获取:http://www.cs.waikato.ac.nz/ml/WEKA。用户既可以下载一个与具体操作系统相匹配的安装文件,也可以下载一个可执行的Java包文件,然后在已安装了Java的机器上以通常的方式运行。
三、课堂教学实例
分类的目的是学会一个分类函数或分类模型(分类器)。该模型能把数据库中的数据映射到给定类别中的某一个。教材中有一个天气的数据集,通过Weka平台演示决策树的生成过程,通过直观教学,使学生掌握决策树算法的本质思想,激发他们掌握算法的兴趣。
1.准备数据。数据通常存于电子数据表格或数据库中。Weka存储数据的原始方式是ARF
您可能关注的文档
最近下载
- 4.3免疫失调课件(共36张PPT)高中生物学 人教版(2019)选择性必修一.pptx VIP
- 新解读《JB_T 8446 - 2013隐极式同步发电机转子匝间短路测定方法》最新解读.docx VIP
- 一种基于伯努利吸附原理的爬壁检测机器人.pdf VIP
- ZEEKR知识自测及参考答案.docx VIP
- 徐宁金枪手人物介绍水浒传.pptx VIP
- 2025年CSP-S初赛真题(文末附答案).pdf VIP
- 江苏开放大学设计思维与创意设计创意元素训练.doc VIP
- (2024新版本)人教版七年级上册生物全册教案.doc
- 自考劳动和社会保障法历年真题.pdf VIP
- 制冷用水平管降膜蒸发器管束换热优化研究.pdf VIP
文档评论(0)