数据挖掘技术在高校课程成绩分析中的应用研究PPT创新.pptVIP

数据挖掘技术在高校课程成绩分析中的应用研究PPT创新.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在高校课程成绩分析中的应用研究PPT创新.ppt

数据挖掘技术在高校课程成绩分析中的应用研究 专业班级: 答辩人: 指导教师: 目录 1、论文研究的目的与意义 2、数据挖掘相关知识 3、粗糙集理论 4、应用粗糙集理论进行学生课程成绩分析 1、论文研究的目的与意义 运用数据挖掘中的粗糙集理论对高校学生课程成绩进行分析,总结,得出相应的结论,供教学管理人员做出相应的决策,有助于今后改变教学方式,提高教学效果。通过论文设计还可以加强学生的理论、知识与技能综合运用能力,对学生获取新知识能力及自学能力的培养有很大帮助。 2、数据挖掘相关知识 (1)数据挖掘的定义: 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 2、数据挖掘相关知识 (2)数据挖掘的方法: 相关性分组或关联规则 聚类分析 统计方法 决策树方法 遗传算法 粗糙集 ....... 2、数据挖掘相关知识 (3)数据挖掘的过程: 对于数据挖掘,数据挖掘的过程可分为问题定义、数据收集与预处理、数据挖掘实施和结果的解释与评估四部分。 3、粗糙集理论 (1)粗糙集的特点: 粗糙集方法的简单实用性是令人惊奇的,它能在创立后的不长时间内得到迅速应用是因为具有以下特点: (a) 它能处理各种数据,包括不完整(incomplete) 的数据以及拥有众多 变量的数据; (b) 它能处理数据的不精确性和模棱两可(ambiguity),包括确定性和 非确定性的情况; (c) 它能求得知识的最小表达(reduct) 和知识的各种不同颗粒层次; (d) 它能从数据中揭示出概念简单,易于操作的模式(pattern); (e) 它能产生精确而又易于检查和证实的规则,特别适于智能控制中规则 的自动生成. 3、粗糙集理论 (2)粗糙集属性的依赖性及其度量: 设 为论域U上的知识库, ,如果 ,就称知识D依赖于知识C,其依赖的程度可表示为: (4-1) 其中 一知识D依赖于知识C的度量; 当 时,D完全由C到导出,也即D完全依赖于C,当 时,D可由C部分导出;当 时,D完全不依赖于C。 记 为D的C正域, ,U为论域。 3、粗糙集理论 (3)粗糙集属性的重要程度: 为了确定某些知识或属性的重要程度,需要考虑去掉这些属性,如果去掉这些属性会相应地改变划分,则说明这些属性强度大,重要性高;反之,强度小,重要性低。属性的重要程度可用公式(4-2)来衡量。 (4-2) 其中 ,C是属性集c导出的划分属性子集。e值越大,说明Xn对C的划分影响程度越高,Xn的重要性越大;如果e=0,则说明该属性子集的去掉不会改变原有的划分,因此它可以从知识库中的属性集中去掉。 4、应用粗糙集理论进行学生课程成绩分析 利用粗糙集理论中的属性重要性分析方法对安徽新华学院信息工程学院计算机科学与技术2班学生成绩进行分析。通过对数据进行预处理,见表4-1。 4、应用粗糙集理论进行学生课程成绩分析 称各个学科为条件属性,记作C;总成绩为决策属性,记作D。 每门学科从高到低排序,分成30%,40%,30%。用1、2、3表示条件属性数据的处理后的结果。用1、2、3、4、5表示决策属性数据处理后的结果。 对这张成绩表进行数据预处理,得表4-2。 总成绩 处理后数据 425分以上 1 375分~424分 2 325分~374分 3 300分~324分 4 300分以下 5 学科成绩(编译原理) 处理后数据 71分(30%内) 3 75分(40%内) 2 82分(30%内) 1 4、应用粗糙集理论进行学生课程成绩分析 4、应用粗糙集理论进行学生课程成绩分析 (1)按D即{1,2,3,4,5}分类如下: 记 为D的C正域, ,U为论域。 总分类 U/D={{7,15,18,28,31,33,35,36},{2,3,4,8,9,16,17,19,20,22, 25,26,29,3

文档评论(0)

w447750 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档