大数据挖掘课程建设研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据挖掘课程建设研究 摘要:为了解决数据挖掘课程建设中存在的不足之处,培养符合时代要求的大数据挖掘人才,引入R语言作为课程的实践软件。R语言作为目前流行的数据分析软件,有着简单易学、功能强大、可扩展性强等特点,在教学过程中可以充分利用其功能包生成各种算法的过程示意图或动画来提高教学效果,同时便于开展课程的实践教学环节。文章对基于R语言的大数据挖掘课程建设进行研究。 关键词:大数据挖掘;R语言;实践;课程建设 1R语言简介 R语言是一种用于统计计算的编程语言和环境,它是由S语言发展而来的。R语言擅长统计建模和解决数据分析相关的问题,是一种为数据而生的程序设计语言。不同于其他主流的计算机编程语言,R语言使用命令加回车的方式进行操作,以人机对话模式进行交互,使用起来较为简单。R的核心要素是数据和函数,任何数据分析都可以理解为通过函数来操作数据,学习R语言无需掌握复杂的语法。R语言可以很方便地和几乎市面上所有的数据库系统相连接,再加上诸多的R数据库支持包,使R能够方便地对数据库进行读写操作,实现的技术包括ODBC和JDBC两大方面(其中RJDBC和RpgSQL需要Java的支持)。R语言中提供了大量数据挖掘相关的函数及功能包[1]。通过以上R语言的简介可以总结出选用R语言作为数据挖掘课程的实践软件有以下5个优点:(1)R语言是免费的,相比多数价格不菲的商业统计软件而言,其优势显而易见。(2)通过数据挖掘课程的学习使得学生认识并掌握R语言的数据分析方法,为学生今后的职业发展提供更加广阔的选择空间。(3)R语言有着强大的图形和动画功能,在教学过程中可以方便地通过R语言生成各种数据挖掘算法的过程示意图和过程演示动画,能有效提高教学效果并增加学生的学习兴趣。(4)R语言的简单、易操作性可以使得拥有不同计算机编程基础的学生都能在较短时间内学会利用R语言进行数据挖掘实践操作,便于开展课程的实践教学。(5)R语言能支持各种数据库系统,因此对于先修课程数据库系统所使用的实践软件无特别要求,方便衔接形成课程体系。 2教学大纲设置 美国计算机学会数据挖掘专门兴趣小组(ACMSIGKDD)曾在2006年拟定了一套公认的标准数据挖掘课程的教学大纲[2]。大纲建议将数据挖掘的教学内容分为基础和高级专题两部分,其中基础部分包括数据挖掘导论,数据预处理,数据仓库与联机分析处理(OnlineAnalyticalProcessing,OLAP),关联规则与频繁模式挖掘、分类、聚类与孤立点分析,时间序列与序列模式,文本与Web挖掘,数据挖掘的可视化,数据挖掘应用十章内容。高级部分主要是对基础部分进行进一步的深入扩展,对不同的挖掘算法进行比较分析,并增加了数据流挖掘、多媒体数据挖掘等内容。考虑到本科阶段该课程的教学总学时一般为32~48学时,且学生的理论背景知识有限,因此需要对标准大纲的内容作一定的调整,对理论部分可以做一定删减而增加一些大数据相关的背景知识,让学生对数据挖掘的大环境有一个完整的认识。同时为了突出培养学生的实践能力,课时安排以实践教学为主,理论教学为辅。实践教学中以学生为主体,教师利用实践任务引导学生学习相关知识,在实践环节中巩固理论教学[3]。可以先安排2~4个学时来讲解R语言的基础知识,让学生掌握R语言在数据挖掘过程中的应用方法,并通过介绍一些大数据挖掘的案例让学生了解数据挖掘技术的主要应用领域及当前的研究热点问题,增强学生对数据挖掘课程的学习兴趣。在充分调动了学生对数据挖掘的兴趣后,可以通过增加课外学习学时来弥补课内学时的不足。教师可以充分利用网络上的大量有关数据挖掘的学习资源,例如一些国外大学的在线课程,教学案例等。对这些资料进行分类整合,并通过邮件、微信公众号等方法推送给学生,提高学生的课后学习效果。 3基于R语言的数据挖掘课程教学 以下以数据挖掘中常用的聚类算法为例,介绍如何利用R语言作为数据挖掘实践软件来开展教学。聚类分析是数据挖掘中一个非常重要的领域,将数据划分成有意义或有用的组(簇),使同一类别内的个体具有尽可能高的同质性,而不同类别之间的个体则应具有尽可能高的异质性[4]。聚类算法有多种,一般分为两大类:基于原型的聚类和基于密度的聚类。本科教材中主要介绍基于原型的K-means算法,在课时充足时也可补充介绍基于密度的Dbscan算法。在介绍完聚类算法的基本概念后,可以通过加载一个名为animation的R包来演示K-means算法的运算过程。该R包中提供了许多关于统计、数据分析类的动画功能,对教学可以起到辅助作用[5]。教师只要调用该包中的相应函数就能生成算法的执行过程动画,并可以通过转换函数将动画转换为GIF和FLASH等格式或者利用LaTeX将动画嵌

文档评论(0)

美鑫可研报告 + 关注
官方认证
服务提供商

我们是专业写作机构,多年写作经验,专业代写撰写文章、演讲稿、文稿、文案、申请书、简历、协议、ppt、汇报、报告、方案、策划、征文、心得、工作总结代写代改写作服务。可行性研究报告,实施方案,商业计划书,社会稳定风险评估报告,社会稳定风险分析报告,成果鉴定,项目建议书,申请报告,技术报告,初步设计评估报告,可行性研究评估报告,资金申请报告,实施方案评估报告

认证主体成都慧辰星信息科技有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510104MA69XDD04C

1亿VIP精品文档

相关文档