ID3算法在教学过程中应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ID3算法在教学过程中应用

ID3算法在教学过程中应用   摘要:在教学过程中,不同的学生适应不同的教学方法,只有选择合适的教学方法才能达到事半功倍的效果。本文使用决策树算法中比较简单适用的ID3算法,通过使用训练数据计算信息增益从而选择分裂属性的次序,由此构建决策树,并将构建好的决策树应用于学生信息,对学生进行分类。   关键词:ID3算法;决策树;分裂属性;信息增益   中图分类号:G642文献标识码:A文章编号:1000-8136(2011)06-0131-02      教学其实也是一种艺术,有多种方法,目的只有一个,就是怎样很好的引导学生朝着他们想要达到的方向前进,这个过程很漫长,在这过程中要采用很多不同的方法来教育学生。但是不同的学生所适用的教学方法是不同的:理科类学生要很有条理的去思考问题,想办法解决问题;文科学生更多是通过感性的方式去理解事物;而工科的学生更多是通过实践或实验数据来解释某些现象。不同年龄阶段的学生所适用的教学方法也不同:低年级的学生要接受更多的新事物、新概念,在讲课时应更多使用图示、列表等形象的方法;高年级的学生已经掌握了一定的基础知识,就应更多的采用引导探究为主的方法,培养学生学习的积极性和主动性。此外性别因素对学生的学习方法也有影响:男同学的动手能力要强一些;而女同学则更擅长语言文字的表达。因此选择适当的教学方法可以在很大程度上提高学生的学习效率,达到因材施教,事半功倍的效果。要对不同类型的学生使用不同的教学方法,首先要根据不同学生的特点对其做适当的分类。   在求解分类问题的方法中,决策树是最有用的一种方法。一旦建好树,就可将其应用于数据库中的元组,并得到分类结果。使用决策树求解分类问题易于理解且高效,对大型数据库具有很好的扩展性。本文通过ID3 算法构建决策树,并将构建好的树应用于数据对学生进行分类。   1决策树算法介绍   决策树学习算法是以实例为基础的归纳学习算法,通常用来形成分类器和预测模型,可以对未知数据进行分类或预测、数据预处理、数据挖掘等。决策树主要适用于对具有多个属性的数据进行分类。决策树算法在解决问题时主要分为两步:第一,构建决策树;第二,将决策树应用于数据。   1.1数据采集   决策树构造的输入是一组带有类别标记的例子,构造的结果是一棵二叉树或多叉树。决策树中每个结点按属性进行标记,每个弧被标记为一个谓词,这个谓词可以应用于相应结点的属性,每个叶节点被标记为一个类。发生分裂的属性叫做分列属性,在构建决策树过程中首先要选择最佳分裂属性。影响学生的学习因素有很多,但是不能都作为分列属性,如性格和社会环境虽然也会影响学生的学习,但如果将其纳入分裂属性会使决策树过于复杂,不利于对数据分类。经过筛选我们选取年级、性别、科目作为分裂属性,由此构造决策树。   通过对数据库中学生信息数据进行转换、加载和处理,同时综合考虑影响学生学习的主要因素选取如表1样本数据集。   表1用于学生分类的训练数据   学号 性别 科目 年级 适应性(演示)   1 女 文 1 是   2 女 理 1 否   3 男 文 1 否   4 男 理 1 否   5 女 工 1 是   6 男 工 1 是   7 女 文 2 是   8 男 文 2 否   9 男 理 2 是   10 女 理 2 否   11 男 工 2 否   12 女 工 2 是   13 男 文 3 否   14 女 文 3 是   15 女 理 3 否   16 女 工 3 否   17 男 理 3 否   18 男 工 3 是   表1中每一条记录表示一个学生的信息,每一列表示学生一方面的属性。其中性别、科目、年级作为分裂属性,对学生是否适应图形、图表演示的教学方法进行判断。   1.2ID3算法的应用   在构造决策树的过程中哪个属性作为分列属性,以及分裂属性次序的选择会影响算法的性能。根据分列属性选择方法的不同有不同的决策树算法。常用的决策树算法有ID3算法,C4.5算法和C5.0算法等。C4.5和C5.0算法主要用于解决连续数据的分类问题。ID3算法则用于解决非连续数据的分类问题。学生的信息属于非连续数据,因此选用ID3算法。   要构建树必须选择分裂属性的次序,ID3算法根据每个分裂属性所产生信息增益的大小对其排序。   表1中共有18条记录,训练数据的初始状态为:适应演示教学法的占(10/18),不适应的占(8/18)。首先计算初始集合的熵为:   H(D)= 10/18log(18/10)+8/18log(18/8)=0.2938   如果选择科目作为分列属性,则文、理、工科均有6个学生,文科学生组成子集的熵为:   4/6log(6/4)+2/6log(6/2

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档