分类算法adaboostM1和filteredclassifier对草药数据分类的比较.doc

分类算法adaboostM1和filteredclassifier对草药数据分类的比较.doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
精品文档(可编辑) 值得下载 分类算法adaboostM1和filteredclassifier对草药数据分类的比较 【摘要】 讨论了在中草药数据分类应用中两种分类器算法filteredclassifier和adaboostM1的分类性能的问题,在weka平台上实验可知,这两种分类器算法中adaboostM1的分类精度比较高。 【关键词】 中草药 AdaBoostM1 weka 一、概述 传统的单分类器算法在草药数据的分类应用是以前比较流行的方法,但随着研究的深入,研究人员发现单分类器对不同的数据有不同的偏向性,无法满足同时对不同数据的分类需求,adaboostM1是一种组合分类器算法,该算法用组合的思想来弥补单分类器算法的不足,filteredclassifier分类器算法是在WEKA平台上的一种传统的单分类器算法。本文首先在weka平台上用两种分类器算法对草药数据集进行分类,然后再对这两种算法的分类精度进行对比,实验表明:在实验数据集为输入样本集的情况下,AdaboostM1算法的分类精度比较高。 二、AdaBoost 算法介绍 1988 年,Kearns 等在研究 PAC 学习模型时提出了一个有趣的问题:弱可学习是否等价于强可学习,即 Boosting 问题,如果这一问题有肯定的回答,意味着只要找到比随机猜测略好的弱学习算法,就可以将其提升为强学习算法,而不必直接去寻找通常情况下很难获得的强学习算法,这对学习算法的设计有着重要的意义。在更深入的研究中,Freund 等发现:在线分配问题与 Boosting 问题之间存在着很强的相似性,引入在线分配算法的设计思想,有助于设计出更实用的 Boosting 算法,他们将加权投票的相关研究成果与在线分配问题结合,并在 Boosting 问题框架下进行对应推广,得到了著名的 AdaBoost算法,该算法不再要求预知弱学习算法的任何先验知识,在实践中获得了极大的成功[1]。 三、在Weka上用AdaBoost算法及几种单分类算法对草药数据进行分类 本文所进行的实验在Weka3-7-1平台上完成,用三种草药三七、人参、西洋参的指纹图谱数据作为实验的数据集。本实验采用的方法是对输入数据集采用5重交叉验证,取其分类精度为的分类性能,分类精度越高表示分类效果越好。 filteredclassifier的参数设置如下: Filter为discretize,基分类器为decisionstump,其他的为默认参数设置。 AdaboostM1的参数设置如下: 基分类器为decisionstump,numiteration为10,seed为1,weightThresold为100。 之后执行RUN界面的START指令,再进入ANALYSE界面载入文件选择分析分类精度,可得到这些算法的平均分类精度如表1所示。 四、实验结果与分析 从表1可以看出,对实验输入的中草药数据集分类中,AdaBoostM1算法的分类精度大于classificationviaregression算法的分类精度。 五、结论 综上所述,在中草药分类领域,在与classificaitnoviaregression算法比较下,可以用AdaBoostM1算法来提高传统单分类器算法的分类性能,从而给了我们一个启发,即可以使用AdaBoostM1算法来进行草药数据集的分类以达到高的精度。 参 考 文 献 [1] 曹莹,苗启广,刘家辰,高琳. AdaBoost算法研究进展与展望[J]. 自动化学报,2013,06:745-758

文档评论(0)

linsspace + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档