weka(InChinese)教程分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* java.lang.String toSummaryString(java.lang.String?title, boolean?printComplexityStatistics) ??????????Outputs the performance statistics in summary form. * Simple EM (expectation maximisation) class. EM assigns a probability distribution to each instance which indicates the probability of it belonging to each of the clusters. EM can decide how many clusters to create by cross validation, or you may specify apriori how many clusters to generate. * evaluateClusterer(Instances?test) ??????????Evaluate the clusterer on a set of instances. 数据预处理 Explorer – Preprocess: Explorer – Select attributes: 还可以在Preprocess页面使用属性选择方法 数据可视化 Explorer – Visualize: 二维散布图 分类预测 Explorer – Classify: Experimenter: 比较多个算法的性能 KnowledgeFlow: 批量/增量学习模式 关联分析 Explorer – Associate: 聚类分析 Explorer – Cluster: 为什么要扩展Weka? 需要加入第三方的构件 需要加入自己设计或改进的算法 需要将Weka整合到实际的应用系统中 要点 重新编译Weka 加入新算法(第三方、自己设计或改进) 在自己的Java程序中使用Weka 下载并安装JDK和JRE环境 (/javase/downloads/index.jsp) 下载并安装WEKA软件 (http://www.cs.waikato.ac.nz/ml/weka/index_downloading.html ) 下载并安装开发环境Eclipse 重新编译weka 解压WEKA安装目录中的weka-src.jar到一个新建目录 weka-src下。 打开Eclipse,“File”菜单 - “New”项目- 选择“Java Project” 。“Project name” 写weka。点击下一步。 设置libraries – Add External Jars。 从weka-src里面复制源代码。 运行weka.gui.GUIChooser。 从weka中文站下载FuzzyCMeans.java 复制到weka.clusterers包中 修改FuzzyCMeans.java,改正错误代码 修改weka.gui.GenericObjectEps ,在#Lists the Clusterers I want to choose from的weka.clusterers.Clusterer=\下加入:weka.clusterers.FuzzyCMeans 重新编译,运行,可以在weka的Explorer界面上的Cluster选项卡中找到刚刚新添加的FuzzyCMeans算法 修改FuzzyCMeans.java中的函数getCapabilities(),以激活FuzzyCMeans算法 重新编译,运行 开发过程中常用的weka组件: Instances---你的数据 Filter---用于预处理数据 Classifier/Clusterer---从预处理后的数据上建立 Evaluating---评价Classifier/Clusterer的优劣 Attribute Selection---从你的数据中去掉不相关的属性 下面介绍如何在Java程序中使用以上组件。 直接读入一个ARFF文件并设置类别属性 import weka.core.Instances; import java.io.BufferedReader; import java.io.FileReader; ... BufferedReader reader = new BufferedReader( new FileReader(/some/where/data.arff)); Instances data = new Instances(reader); rea

文档评论(0)

美洲行 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档