- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
精品文档(可编辑) 值得下载
分类算法adaboostM1和filteredclassifier对草药数据分类的比较
【摘要】 讨论了在中草药数据分类应用中两种分类器算法filteredclassifier和adaboostM1的分类性能的问题,在weka平台上实验可知,这两种分类器算法中adaboostM1的分类精度比较高。
【关键词】 中草药 AdaBoostM1 weka
一、概述
传统的单分类器算法在草药数据的分类应用是以前比较流行的方法,但随着研究的深入,研究人员发现单分类器对不同的数据有不同的偏向性,无法满足同时对不同数据的分类需求,adaboostM1是一种组合分类器算法,该算法用组合的思想来弥补单分类器算法的不足,filteredclassifier分类器算法是在WEKA平台上的一种传统的单分类器算法。本文首先在weka平台上用两种分类器算法对草药数据集进行分类,然后再对这两种算法的分类精度进行对比,实验表明:在实验数据集为输入样本集的情况下,AdaboostM1算法的分类精度比较高。
二、AdaBoost 算法介绍
1988 年,Kearns 等在研究 PAC 学习模型时提出了一个有趣的问题:弱可学习是否等价于强可学习,即 Boosting 问题,如果这一问题有肯定的回答,意味着只要找到比随机猜测略好的弱学习算法,就可以将其提升为强学习算法,而不必直接去寻找通常情况下很难获得的强学习算法,这对学习算法的设计有着重要的意义。在更深入的研究中,Freund 等发现:在线分配问题与 Boosting 问题之间存在着很强的相似性,引入在线分配算法的设计思想,有助于设计出更实用的 Boosting 算法,他们将加权投票的相关研究成果与在线分配问题结合,并在 Boosting 问题框架下进行对应推广,得到了著名的 AdaBoost算法,该算法不再要求预知弱学习算法的任何先验知识,在实践中获得了极大的成功[1]。
三、在Weka上用AdaBoost算法及几种单分类算法对草药数据进行分类
本文所进行的实验在Weka3-7-1平台上完成,用三种草药三七、人参、西洋参的指纹图谱数据作为实验的数据集。本实验采用的方法是对输入数据集采用5重交叉验证,取其分类精度为的分类性能,分类精度越高表示分类效果越好。
filteredclassifier的参数设置如下:
Filter为discretize,基分类器为decisionstump,其他的为默认参数设置。
AdaboostM1的参数设置如下:
基分类器为decisionstump,numiteration为10,seed为1,weightThresold为100。
之后执行RUN界面的START指令,再进入ANALYSE界面载入文件选择分析分类精度,可得到这些算法的平均分类精度如表1所示。
四、实验结果与分析
从表1可以看出,对实验输入的中草药数据集分类中,AdaBoostM1算法的分类精度大于classificationviaregression算法的分类精度。
五、结论
综上所述,在中草药分类领域,在与classificaitnoviaregression算法比较下,可以用AdaBoostM1算法来提高传统单分类器算法的分类性能,从而给了我们一个启发,即可以使用AdaBoostM1算法来进行草药数据集的分类以达到高的精度。
参 考 文 献
[1] 曹莹,苗启广,刘家辰,高琳. AdaBoost算法研究进展与展望[J]. 自动化学报,2013,06:745-758
文档评论(0)