大学生体育训练决策支持系统中ID3算法改进研究.docVIP

大学生体育训练决策支持系统中ID3算法改进研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大学生体育训练决策支持系统中ID3算法改进研究

大学生体育训练决策支持系统中ID3算法改进研究   摘 要:引入ID3算法的大学生体育训练决策支持系统可以根据学生的特征对其分类。而传统的决策树ID3算法存在多值倾向的问题,选择分裂属性不符合客观事实。本文运用了一种基于灰色关联度的修正因子属性选择方法予以改进,克服了传统ID3算法的不足,改进的ID3算法可使分类更加精确,更好的为大学生体育训练提供决策支持。   关键词:ID3算法 决策支持系统 数据挖掘 灰色关联度   中图分类号:G434 文献标识码:A 文章编号:1674-098X(2014)02(a)-0019-01   大学生体育训练决策支持系统是随着人工智能理论与数据挖掘技术的发展而不断发展的,通过对大学生身体素质和训练等数据来进行有效的挖掘,产生用于辅助决策的规则,进而为大学生体育训练制定相应的训练方案[1]。系统中应用了数据挖掘的决策树ID3算法对不同特征的学生进行分类,但传统的ID3算法存在多值倾向的问题,选择分裂属性不符合客观事实,同时,在构造树的过程中,需要多次自上而下对数据集的排序和扫描,因而导致算法的处理效率较低[2],如何改进算法从而使分类更加精确是我们亟需解决的问题。   1 ID3算法的改进   灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,分析考虑了各因素之间的相关性,比系统分析中常用的因素两两对比法要更合理,更科学[3]。同时考虑到正弦函数的曲线变化比较缓和,对信息增益因子修正不会出现过度的问题。因此,本文引入灰色关联度的正弦值作为ID3算法的修正因子进行改进。改进的ID3算法的具体流程是:   (1)计算各特征属性与类别属性之间的灰色关联度,并将它们排序;   (2)对取值较多的属性通过灰色关联度来判断是否最优,从而确定是否降低它的信息增益;   (3)对取值较多但灰色关联度低的属性,在计算其信息增益时通过灰色关联度的正弦值作为修正因子,而其它属性计算信息增益时修正因子设为0。   改进的ID3算法的描述如下:   算法:GBID(Sample_set,Attribute_set)   输入:由多个属性描述的训练样本集Sample_set;候选属性集Attribute_set。   输出:一棵决策树。   Begin   如果 Sample_set为空   则返回null;创建结点L;   如果结点L中的所有样本均属于同一类C   则返回L作为叶结点,并以类C为标记;   如果Attribute_set为空   则返回L作为叶结点,并以Sample_set中最普通的类标记;   计算出Attribute_set中每个属性的信息增益,并选择出信息增益最大的属性A和取值个数最多的属性B   如果 A=B,该条件成立说明选择信息增益最大和取值个数最多的属性作为测试属性易产生多值偏向问题,需要用修正因子降低该属性的信息增益   则根据公式   属性A具有多值倾向是其它来计算该属性的修正因子;   再根据公式重新计算该属性的信息增益;   否则该属性的修正系数为0,信息增益最大的属性不是取值个数最多属性,选择该属性作为分裂属性不会产生多值偏向问题,不需要用修正系数降低该属信息增益   从Attribute_set中选择出信息增益最大的属性Splitting_Attribute作为分裂属性;   标记结点L为Splitting _Attribute;   For Each Splitting_Attribute中的已知;   m为Splitting_Attribute的取值个数∥根据Splitting_Attribute的取值划分Sample_set   根据Splitting_Attribute=,从结点L产生相应分支表示测试条件;   设为Splitting_Attribute=所获得的样本集;   如果为空   则加上一个叶结点,并标记为Sample_set中最普通的类;   否则加上GBID(Attribute_set,Splitting _Attribute)返回的结点;   End。   2 改进后的ID3算法的应用   我们选取十个学生的篮球训练样本集作说明,每个学生有四个属性,分别为力量、身高、灵活性、速度。每条学生记录为(学号 力量 身高 灵活性 速度 评价),十条学生记录为高好慢Y),高好块Y),矮好慢Y),中一般慢N),中差慢N),中差块N),矮差快N),高一般慢Y),高差慢N),中一般慢N)。力量为强、弱,量化为{0,1};身高为高、中、矮分别量化为{0,1,2}

您可能关注的文档

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档