项目驱动数据挖掘教学模式探讨.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
项目驱动数据挖掘教学模式探讨

项目驱动数据挖掘教学模式探讨   摘要:数据挖掘是计算机专业的一门重要的专业课。首先介绍了ACM SIGKDD制定的数据挖掘课程教学大纲,然后以实际的铝电解生产多维分析系统和铝电解生产数据挖掘系统为主线,重新组织了项目驱动的数据挖掘课堂教学内容和实践教学内容。   关键词:数据挖掘;SIGKDD;项目驱动;教学大纲   作者简介:宋威(1980-),男,辽宁抚顺人,北方工业大学信息工程学院,副教授;李晋宏(1965-),男,山西太原人,北方工业大学信息工程学院,教授。(北京#8194;100144)   基金项目:本文系北京市优秀人才培养资助项目(2009D005002000009)、北方工业大学教育教学改革和课程建设基金项目的研究成果。   中图分类号:G642 文献标识码:A 文章编号:1007-0079(2011)27-0176-02      近年来,随着数据获取和数据存储技术的快速发展,各种数据库、数据集市和数据仓库中存储的数据量飞速增长。数据挖掘[1]的出现,为人们提供了一条解决“数据丰富而知识贫乏”困境的有效途径。   目前,国内外众多知名高校都开设了“数据挖掘”课程,如:美国斯坦福大学、英国爱丁堡大学、中国科学院研究生院、北京大学、清华大学等。课程基础理论部分一般包括数据预处理、分类、聚类、关联规则、最新进展等内容,实践教学及案例分析部分一般包括数据挖掘软件介绍、案例分析等。经过反复调研发现,目前“数据挖掘”课程主要存在两方面的问题:一是内容较为分散,缺乏明确的主线,没有较好地体现数据挖掘研究应用驱动的本质;[2]二是所演示的实例一般规模较小,没能较好地体现挖掘对象的海量性特性。   本文探讨了项目驱动[3]的数据挖掘教学模式。一方面,授课内容严格选自国际权威的教学大纲;另一方面,按照实际的多维分析与数据挖掘项目重新组织授课内容、安排实践环节,从而明确了课程的主线,并对引导学生学以致用起到了积极的作用。   一、SIGKDD教学大纲   2006年,美国计算机学会数据挖掘专门兴趣小组(ACM SIGKDD)组织专家,从数据库、数据预处理、统计推理、评价标准、算法复杂度、挖掘结果的后处理、可视化与可理解性、模型的维护与更新8个方面,制定了一份数据挖掘的教学大纲。[4]大纲建议将数据挖掘的教学内容分为基础和高级专题两部分,其中基础部分是数据挖掘课程需要覆盖的内容,而高级专题部分则供有条件的学校选择性的开设。   1.数据挖掘课程的基础部分   基础部分分为导论、数据预处理、数据仓库与OLAP、关联规则与频繁模式挖掘、分类、聚类与孤立点分析、时间序列与序列模式、文本与Web挖掘、数据挖掘的可视化、数据挖掘应用10章,共计46节内容。   基础部分的讲授重点在于明确数据挖掘的研究动机,梳理数据挖掘与数据库、机器学习及统计学之间的关系,介绍数据挖掘的基本概念、基本算法、主要的评价参数及典型的应用。通过学习,学生应具备一定的应用数据挖掘方法解决实际问题的能力,并为从事专门的科学研究奠定基础。   2.数据挖掘课程的高级专题   高级专题部分分为15章,共计70节。其中:数据预处理,数据仓库与OLAP,关联规则与频繁模式挖掘,分类,聚类分析,时间序列与序列模式,文本挖掘,超文本与Web挖掘,数据挖掘应用这9章内容与基础部分重叠,不同之处在于通过引入了更为复杂的算法及最新的典型应用,对基础部分内容进行了扩展;数据流挖掘,时空与多媒体数据挖掘,生物数据挖掘这3章内容体现了数据类型的不断丰富;而数据挖掘语言、标准及系统架构,数据挖掘与社会,数据挖掘的最新进展这3章内容则讨论了数据挖掘研究的本质问题,并随时跟踪前沿热点问题。   高级专题部分的讲授重点在于介绍各种方法的优缺点,并将各种挖掘方法的对象由结构化数据向复杂类型数据拓展,引领学生达到数据挖掘研究的入门及以上水平。   3.数据挖掘课程的实践教学   按照由浅入深的顺序,数据挖掘课程的主要实践教学内容包括:   学会使用常用的数据挖掘软件,如:Microsoft SQLServer Analysis Services、Oracle ODM、IBM Intelligent-Miner等。   通过参考开源数据挖掘软件(如Weka),实现常用的数据挖掘算法。   在KDD CUP、UCI Machine Learning/KDD Repository、DBLP等基准数据库上比较各种算法的性能。   二、SIGKDD大纲具体应用的探讨   SIGKDD数据挖掘教学大纲的颁布为讲授数据挖掘课程提供了蓝本,通过在北方工业大学3年来的实践,我们认为在实际应用中,有如下3个问题值得探讨。   SIGKDD教学大纲的内容充分体现了数据挖掘多

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档