- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘工具(weka教程)概要1
* java.lang.String toSummaryString(java.lang.String?title, boolean?printComplexityStatistics) ??????????Outputs the performance statistics in summary form. * Simple EM (expectation maximisation) class.EM assigns a probability distribution to each instance which indicates the probability of it belonging to each of the clusters. EM can decide how many clusters to create by cross validation, or you may specify apriori how many clusters to generate. * evaluateClusterer(Instances?test) ??????????Evaluate the clusterer on a set of instances. 数据预处理 Explorer – Preprocess: Explorer – Select attributes: 还可以在Preprocess页面使用属性选择方法 数据可视化 Explorer – Visualize: 二维散布图 分类预测 Explorer – Classify: Experimenter: 比较多个算法的性能 KnowledgeFlow: 批量/增量学习模式 关联分析 Explorer – Associate: 聚类分析 Explorer – Cluster: 为什么要扩展Weka? 需要加入第三方的构件 需要加入自己设计或改进的算法 需要将Weka整合到实际的应用系统中 要点 重新编译Weka 加入新算法(第三方、自己设计或改进) 在自己的Java程序中使用Weka 下载并安装JDK和JRE环境 (/javase/downloads/index.jsp) 下载并安装WEKA软件 (http://www.cs.waikato.ac.nz/ml/weka/index_downloading.html ) 下载并安装开发环境Eclipse 重新编译weka 解压WEKA安装目录中的weka-src.jar到一个新建目录 weka-src下。 打开Eclipse,“File”菜单 - “New”项目- 选择“Java Project” 。“Project name” 写weka。点击下一步。 设置libraries – Add External Jars。 从weka-src里面复制源代码。 运行weka.gui.GUIChooser。 从weka中文站下载FuzzyCMeans.java 复制到weka.clusterers包中 修改FuzzyCMeans.java,改正错误代码 修改weka.gui.GenericObjectEps ,在#Lists the Clusterers I want to choose from的weka.clusterers.Clusterer=\下加入:weka.clusterers.FuzzyCMeans 重新编译,运行,可以在weka的Explorer界面上的Cluster选项卡中找到刚刚新添加的FuzzyCMeans算法 修改FuzzyCMeans.java中的函数getCapabilities(),以激活FuzzyCMeans算法 重新编译,运行 开发过程中常用的weka组件: Instances---你的数据 Filter---用于预处理数据 Classifier/Clusterer---从预处理后的数据上建立 Evaluating---评价Classifier/Clusterer的优劣 Attribute Selection---从你的数据中去掉不相关的属性 下面介绍如何在Java程序中使用以上组件。 直接读入一个ARFF文件并设置类别属性 import weka.core.Instances; import java.io.BufferedReader; import java.io.FileReader; ... BufferedReader reader = new BufferedReader( new FileReader(/some/where/data.arff)); Instances data = new Instances(reader); rea
文档评论(0)