- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据挖掘技术在计算机基础课程教学中应用
大数据挖掘技术在计算机基础课程教学中应用
摘要:应用数据挖掘技术对参加计算机基础课程的学生常规期末考试成绩进行挖掘分析,提取有价值的信息,寻找出教学中存在的问题,并利用粗糙集理论各个条件属性对决策属性影响力的不同,计算出各种题型对考试结果的重要性,进而确定影响学生考试成绩的重要知识点,从而指导教师有重点地研究分析下一步教学活动。应用实践表明,在计算机基础课程的常规考试中,利用大数据粗糙集理论属性重要性来分析判断学生所学的不同知识点对成绩影响的程度,结果与实际情况是吻合的。
关键词:大数据挖掘;粗糙集理论;计算机基础课程
中图分类号:G642.41 文献标志码:A 文章编号:1674-9324(2017)28-0272-02
计算机基础课程是高校学生学习计算机的入门课程,不管是计算机专业的学生还是非计算机专业学生都是必须学的,也是必须掌握的计算机技术。本文尝试在计算机基础课程的教学中应用大数据挖掘技术,运用粗糙理论、模糊理论、数理统计作为理论基础,以事实数据作为理论基础进行分析研究,对学生掌握的基础理论知识以及理解程度有一个准确的了解和掌握,从而为计算机专业的讲师开展计算机教学提供可靠的事实与数据理论依据。
一、大数据及挖掘技术相关的概念
大数据(big data,mega data),顾名思义就是很大的数据,或称海量数据、巨量资料,具有Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值),又称为4V特点。
数据挖掘技术则是从海量的、不完全的、随机的、模糊的数据中,提取人们事先不知道并且是隐藏的数据中的,研究分析的有用信息和知识为我所用,为将来所用。如何对庞大的、海量的、复杂的、不完全、不完整的大数据进行统计分析、推理,发现数据之间隐藏的规律为我所用?如何对大数据这个不精确、不完全的知识的表达与分析,这是大数据背景下高校特别是计算机应用专业的教师、学生应该学习的最重要的基础知识,掌握并利用大数据挖掘及其相关技术基础理论知识。
二、大数据挖据技术对计算机教学的指导作用
利用挖掘技术对大数据进行挖掘,可以为国家出台相关政策与决策提供相应的依据,也可为高校教师在教学的过程中提供优秀教学理论与能与时俱进改进教学方法与内容,为知识的更新转化提供一个新的、更好的平台。为以后的定向业务数据学会数据的挖掘。学会准备数据、挖掘数据、分析数据、结果分析、得出结论,为下一步的发展提出指导性意见与建议。
目前大数据挖掘技术的主要方法有大数据数理模型理论、神经网络模型理论、模糊理论以及粗糙集理论算法技术、决策树、三角几何技术等相关数学方法统计分析、归纳等。
(一)利用粗糙集理论对大数据进行挖掘
粗糙集理论是科学家研究不精确、不确定性信息的技术,而目前网络大数据恰恰具有这样的特点,挖掘大数据本身所反映出信息和挖掘隐含的价值信息,不附加信息或经验知识,得出的结论相对说比较客观、真实,更加符合所统计对象的实际情况,对以后决策抑或改变更加有据可依,有据可查。使用粗糙集理论对信息大数据进行挖掘,就是通过对大数据进行分类、合并同类、属性约简、属性归类等必要的压缩,从而找出大数据的规律,找出有价值的信息,预测对象发展趋势,发展变化,从而制订相应的策略方法,降低成本,扩大收益。
(二)举例说明如下
计算机基础课程在学期结束时,学生将参加期末计算机应用能力考试,考试内容共分为七项:第一项是选择题,设分值40分;第二项是网络应用题,设分值为10分;第三项是计算机系统操作,设分值8分;第四项是办公软件应用,四项一分项是Word应用,设分值为18分;四项二分项Excel应用,设分值为14分;四项三分项是Power-Point应用,设分值为10分。
笔者从2015级非计算机应用专业抽取30名同学,来参加一次模拟考试,把模拟考试数据进行了整理,形成了原始考试成绩表如表1所示。
上表中,用S1、S2、…、S6分别表示选择题、网络应用题、计算机系统操作、办公软件Word操作、办公软件Excel操作、办公软件PowerPoint操作,g代表总成绩。
(三)设定标准进行数据分析
我们把学生总成绩按不同分数段进行离散化处理,首先分数百分化,也就是将得分乘以100后除以设置分。把学生得分总成绩按80―100、60―79、0―59分划分为优秀、合格、不及格,设为1、2、3。利用?x散化的方法得出下表2。
(四)数据挖掘分析
设C={S1,S2,S3,S4,S5,S6},决策属性D={g},根据粗燥集理论公式决策属性D的重要性公式,分别计算各个条件对决策属性D影响率,结果如下,
SGF(S1,C,D)=0.38,SGF(S2,C,D)
原创力文档


文档评论(0)