数据挖掘工具软件介绍weka.pptVIP

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘工具软件介绍weka

* GenericObjectEditor 对话框可以用来配置一个筛选器。同样的对话框也用于配置其他 对象,例如分类器(classifier)和聚类器(clusterers)(见下文)。 * 点击More options 按钮可以设置更多的测试选项: 1. Output model. 输出基于整个训练集的分类模型,从而模型可以被查看,可视化 等。该选项默认诗选中的。 2. Output per-class stats. 输出每个 class 的准确度/反馈率(precision/recall) 和正确/错误(true/false)的统计量。该选项也是默认选中的 3. Output evaluation measures. 输出熵估计度量。该选项默认没有选中。 4. Output confusion matrix. 输出分类器预测结果的混淆矩阵。该选项默认选中。 5. Store predictions for visualization. 记录分类器的预测结果使得它们能被可 视化表示。 6. Output predictions. 输出测试数据的预测结果。注意在交叉验证时,实例的编 号不代表它在数据集中的位置。 7. Cost-sensitive evaluation. 误差将根据一个价值矩阵来估计。Set… 按钮用来 指定价值矩阵。 8. Random seed for xval / % Split. 指定一个随即种子,当出于评价的目的需要 分割数据时,它用来随机化数据。 * Cli实验命令:java weka.experiment.Experiment -r -T data/iris.arff -D weka.experiment.InstancesResultListener -P weka.experiment.RandomSplitResultProducer -- -W weka.experiment.ClassifierSplitEvaluator -- -W weka.classifiers.rules.OneR 在两种模式下,你都进行在本地单一机器上的标准试验,或者分布在几台主机上的远程试验。分布 式的试验减少了完成试验本身所需的时间,但是另一方面,设置这样的试验需要更多的时间 * 而且,可在 Classification(分类,又称判别)和 Regression(回归)间进行选择,这依赖于所用 的数据集和分类器(classifiers)。对于像J48 (即 Quinlan 的 C4.5 算法 [3] 在 Weka 中的实现) 这 样的决策树算法和 iris 数据集,Classification 是必需的;另一方面,对于 M5P 这样的数值型分类器, 则需要选用Regression。默认选中的是 Classification。 * 为了获得统计上有意义的结果,默认的迭代数量是 10。在10折交叉验证的情形下,这意味着对一个分类器要进行100次调用——从训练集计算它,并在测试集上测试。 * 算法:J48 决策树 Quinlan * * 数据挖掘软件介绍 目前较为著名的数据挖掘软件 传统的数据挖掘套件(Classic suites): SAS Enterprise Miner 5.3 SPSS Clementine 12 开源数据挖掘软件(Open Source): RapidMiner 4.2 / KNIME 2.0 / Weka 3.6 专门化的数据挖掘软件(Specialized): Viscovery SOMiner 5.0 prudsys Discovery 5.5 / Basket Analyzer 5.2 Bissantz Delta Master 5.3.6 * 目前较为著名的数据挖掘软件 自动化数据挖掘软件(Self-Acting): KXEN Analytic Framework 4.04 BI产品内置的数据挖掘软件(BI Vendors): SAP NetWear 7.0 Data Mining Workbench Oracle 11g Data Mining Microsoft SQL Server 2005 Analysis Services 其他优秀的软件 Teradata Warehouse Miner IBM的DB2 Intelligence Miner Angoss的KnowledgeSTUDIO Unica * WEKA 简介 http://www.cs.waikato.ac.nz/ml/weka 中文论坛/ 功能 Program LogWindow MemeryUsage Exit Visualization * WEKA PLOT ROC Tre

文档评论(0)

sheppha + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5134022301000003

1亿VIP精品文档

相关文档