Weka中的C4#46;5使用.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Weka中的C4amp;#46;5使用.pdf

Weka 中 C4.5 的使用 林联锋 0809853F-II20-0014 2008-10-16 一、C4.5 以及Weka 的介绍1 二、Weka 的分类功能的使用2 2.1 、Weka界面简介2 2.2 、Weka接受的数据格式3 2.3 、Weka分类实例演示5 2.3.1 、数据准备5 2.3.2 、训练分类器6 2.3.3 、建模结果10 2.3.4 、模型运用12 三、总结14 四、附件:14 一、C4.5 以及Weka 的介绍 由于 ID3 算法在实际应用中存在一些问题,于是 Quilan 提出了 C4.5 算法,严格上说 C4.5 只能是ID3 的一个改进算法。 C4.5 算法继承了 ID3 算法的优点,并在以下几方面对 ID3算法进行了改进: 1、用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性 的不足; 2、在树构造过程中进行剪枝; 3、 能够完成对连续属性的离散化处理; 4、能够对不完整数据进行处理。 C4.5 算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树 的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。此外,C4.5 只适合于能够驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。 这里重点介绍对 C4.5 算法实现的一个著名软件 Weka。Weka 的全名是怀卡托智能分析 环境(Waikato Environment for Knowledge Analysis ),是一款免费的,非商业化(与之对应 的是 SPSS 公司商业数据挖掘产品--Clementine )的,基于 JAVA 环境下开源的机器学习以 及数据挖掘软件。它和它的源代码可在其官方网站下载。有趣的是,该软件的缩写 WEKA 也是 New Zealand 独有的一种鸟名,而 Weka 的主要开发者同时恰好来自 New Zealand 的 University of Waikato 。 WEKA 作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学 1 习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的 可视化。而开发者则可使用 Java 语言,利用 Weka 的架构上开发出更多的数据挖掘算法。本 文将关注 Weka 的分类功能,并用实际例子对这一功能进行演示,希望可以对加深对 Weka 的使用以及了解C4.5 在决策中的重要作用。 二、Weka 的分类功能的使用 2.1、Weka界面简介 图2.1 图2.1 为 Weka 的启动后的界面,非常简介,我们将会用到界面中Application 选项下的 Explorer 功能。界面如图2.2 : 2 图2.2 “`open file” 按钮可以让用户导入需要分析的数据文件。这里不做具体的操 作介绍,详情请见:http://www.cs.waikato.a

文档评论(0)

cnsg + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档