数据挖掘技术在数字化校园中的应用研究.docVIP

数据挖掘技术在数字化校园中的应用研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在数字化校园中的应用研究   摘要:本文在讨论数据挖掘技术的基本概念、决策树方法的基础上,提出了决策树算法在数字化校园中的应用,以高校学生等级的划分为例介绍了该算法的实施过程,并对结果进行了分析,得出供高校管理者决策的结论。   关键词:数据挖掘;决策树算法;数字化校园;学生等级   中图分类号:G64文献标识码:B   文章编号:1672-5913(2007)06-0040-04      1 引言      数字化校园是以数字化信息为依托,利用计算机技术、网络技术、通讯技术支持学校教学和管理信息流,实现教育、教学、科研、管理、技术服务等信息收集、处理、整合、存储、传输、应用,使教学资源得到充分优化利用的一种虚拟教育环境[1]。数字化校园建设已经成为现代高校建设的重要组成部分,如何更好地利用数字化校园信息,提高高校教学效率,从而为社会培养出更多高素质人才,是一个值得研究的问题。数字化校园是面向教师和学生的,并为教师和学生服务。利用数据挖掘技术,在了解学生的各个方面信息的基础上,通过决策树算法得到学生学习成绩的总体发展趋势,为高校教学提供决策支持作用。      2 数据挖掘技术      2.1 数据挖掘的基本概念   数据挖掘(Data Mining,DM)是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们不知道的,但又是潜在有用的信息和知识的过程[2]。目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据,进而预测未来可能发生的行为,从而为决策行为提供有利的支持。   2.2 决策树方法   决策树方法是数据挖掘的核心技术算法之一,通过大量数据有目的地分类,从中找出一些潜在的、对决策有价值的信息,常用于预测模型中。目前,国际上最有影响力的决策树方法是ID3决策树生成算法,C4.5算法是ID3算法的改进,该算法主要采用信息增益比来确定被测试的属性[3]。   决策树(Decision Tree)是一个类似于流程图的树结构,其中每个内部节点表示在一个属性上的测试,每个分支代表一个测试输出,而每个树叶节点代表类或类分布。树的最顶层节点是根节点。通常情况下,采用自顶向下递归的各个击破的方式构造决策树,在此过程中,选择合适的属性作为测试属性;采用剪枝方法控制生成的决策树的大小;是两个关键的问题。   决策树的基本算法是贪心算法,它以自顶向下递归的各个击破方式构造决策树,算法Generate_ decision_tree生成一棵决策树的基本步骤。   输入:训练样本samples,由决策属性表示,候选属性的集合attribute_list。   输出:一棵决策树。   (1)创建节点N;   (2)if samples 都在同一个类C then;   (3)返回N作为叶节点,以类C标记;   (4)if attribute_list为空,以类C标记;   (5)返回N作为叶节点,标记为samples中最普通的类,//多数表决;   (6)选择attribute_list中具有最高信息增益的属性test_attribute;   (7) 标记节点N为test_attribute;   (8)for each test_attribute中的已知值ai //划分samples;   (9)由节点N长出一个条件为test_attribute= ai的分支;   (10)设si是samples中test_attribute= ai的样本的集合,//一个划分;   (11)if si为空then;   (12)加上一个树叶,标记为samples中最普通的类;   (13)else加上一个由Generate_decision_tree返回的节点。   以上递归步骤当下列条件成立时停止:   (1)给定节点的所有样本属于同一类;   (2)没有剩余属性可以用来进一步划分样本,在此情况下,使用多数表决;   (3)分支test_attribute= ai没有样本,在这种情况下,以samples中的多数类创建一个树叶。      3 数字化校园整体框架      基于当前高等院校校园网的基本设施和已有的各种应用服务,一个基于通用的统一身份认证和统一信息展示的数字化校园解决方案的总体框架。这个框架能够集成各种校园网中的应用。各个子系统在数字化校园中的位置如图1所示。   在这个数字化校园框架中,利用PKI体系结构作为统一身份认证系统的基础,以LDAP目录作为校园网内各种身份和信息数据的存储媒体,从而实现Portal信息展示平台,为校园网内各种应用服务的集成与展现提供了途径。      4 数据挖掘技术在数

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档