[工学]属性选择与遗传算法.pptVIP

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[工学]属性选择与遗传算法

属性选择和遗传算法 主要内容 什么是属性选择及如何构建和运行属性选择程序 什么是遗传算法,如何使用遗传算法来解题? 属性选择 属性选择的重要性(why Attribute Selection?) 属性选择的定义 属性选择的步骤 属性选择的子集空间 Weka下面是如何进行属性选择的 如何在Weka下构建属性选择程序 Weka图形界面下如何执行属性选择 DOS下如何运行属性选择程序 Why Attribute Selection? 现实世界的数据集合或数据库中不仅包含数量巨大的记录,而且包含大量于与任务不相关的属性 冗余属性(不相关属性)的作用: 大大影响算法效率 甚至还可能导致结果的偏差 结论: 必须进行有效的数据约减 (Reduct – Rough Set) 数据约减 数据约减是在对发现任务和数据本身内容理解的基础上寻找依赖于发现目标的表达数据的有用特征,以缩减数据规模,从而在尽可能保持数据原貌的前提下最大限度的精简数据量。 约简的对象 数据约减的途径: 属性选择(纵向) 针对数据库中的属性 数据抽样(横向) 针对数据库中的记录 属性值的约简 类似于离散化 属性选择定义 属性选择是指在初始的N个属性中选择出一个有m(mN)个属性的子集,这m个属性可以像原来的N个属性一样用来正确区分数据集中的每个数据对象。 NB. Variant! 注意: 从N个属性的属性集合中选择出M(M?N)个属性 这M个属性可以和原来的N个属性一样描述数据集 这M个属性一样可以区分数据集中的数据对象 属性选择的基本步骤 输入 全部属性 输出 满足某种条件的属性子集 四个基本步骤: 子集产生 子集评估 停止准则 结果有效性验证 (1) 子集产生 子集产生是一个搜索过程,它产生用于评估的属性子集 对于含有N个属性的属性集合,它的子集共有2N个 如何从这2N个子集中选择一个合适的子集? 搜索 评估 (2)子集评估 子集产生过程所生成的每个子集都需要用事先确定的评估准则进行评估,并且与先前符合准则最好的子集进行比较,如果它更好一些,那么就用它替换前一个最优的子集。如果没有一个合适的停止规则,在属性选择进程停止前,它可能无穷无尽地运行下去。 (3)停止准则 属性选择过程可以在满足以下条件之一时停止: 一个预先定义所要选择的属性数 预先定义的迭代次数 是否增加(或删除)任何属性都不产生更好的子集 (4)有效性验证 选择的最优子集需要通过在所选子集和原属性集进行不同的测试和比较,使用人工和现实世界的数据集对产生的结果进行有效性验证。 属性选择中最重要的两个步骤 子集产生过程 子集搜索 属性评估 属性子集评估 单属性评估 属性选择的子集空间 以天气数据集为例 该数据集合有4个属性 这4个属性有24个子集 这么多子集如何组织? 子集搜索的方向 从上往下 朝下的方向,开始时是不含任何属性,然后每次增加一个,称为正向选择 是从下往上。 朝上的方向,开始包含了所有的属性,然后每次减少一个,称为反向消除 属性评估 针对相应的问题,选择合适的属性评估方法 属性评估方法 单属性评估方法 InfoGain GainRatio OneR …. 子集评估方法 Consistency Wrapper Classifier …. Weka下的属性选择 Weka下的属性选择的位置 在weka.attributeSelection包下 attributeSelection包下程序的分类 主程序 评价方法 搜索方法 接口 如何构建Weka下的属性选择程序? 至少应该包含两部分: 评价方法 子集评价方法 单属性评价方法 搜索方法 如何写搜索方法? 继承ASSearch,实现search()方法 如何写评价方法? 单属性评价方法:继承AttributeEvaluator(),实现buildEvaluator()和attributeEvaluation()方法 子集评价方法:继承SubsetEvaluator(),实现buildEvaluator()和attributeEvaluation()方法 如何运行已经写好的属性选择方法? 将AttributeSelection.java设置为运行的主类 attributeEvaluation或者subsetEvaluation方法作为参数 search方法也作为参数 数据集的路径及名称 图形界面下运行属性选择 启动weka图形界面 选择explorer界面 选择select attribute选项卡 选择数据集 选择使用的搜索方法 选择使用的评价方法 运行 DOS下如何运行属性选择程序 转向weka所在的目录 d: cd d:\eclipse\workspace\weka-3-4-13 运行命令: java weka.attributeSelect

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档