分类算法adaboostM1和filteredclassifier对草药数据分类的比较.doc

下载文档 降价啦

9
0
约1.54千字
约 3页
2020-11-27 发布于福建
举报
版权申诉
保障服务

分类算法adaboostM1和filteredclassifier对草药数据分类的比较.doc

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

精品文档（可编辑）值得下载分类算法adaboostM1和filteredclassifier对草药数据分类的比较【摘要】讨论了在中草药数据分类应用中两种分类器算法filteredclassifier和adaboostM1的分类性能的问题，在weka平台上实验可知，这两种分类器算法中adaboostM1的分类精度比较高。【关键词】中草药 AdaBoostM1 weka 一、概述传统的单分类器算法在草药数据的分类应用是以前比较流行的方法，但随着研究的深入，研究人员发现单分类器对不同的数据有不同的偏向性，无法满足同时对不同数据的分类需求，adaboostM1是一种组合分类器算法，该算法用组合的思想来弥补单分类器算法的不足，filteredclassifier分类器算法是在WEKA平台上的一种传统的单分类器算法。本文首先在weka平台上用两种分类器算法对草药数据集进行分类，然后再对这两种算法的分类精度进行对比，实验表明：在实验数据集为输入样本集的情况下，AdaboostM1算法的分类精度比较高。二、AdaBoost 算法介绍 1988 年，Kearns 等在研究 PAC 学习模型时提出了一个有趣的问题：弱可学习是否等价于强可学习，即 Boosting 问题，如果这一问题有肯定的回答，意味着只要找到比随机猜测略好的弱学习算法，就可以将其提升为强学习算法，而不必直接去寻找通常情况下很难获得的强学习算法，这对学习算法的设计有着重要的意义。在更深入的研究中，Freund 等发现：在线分配问题与 Boosting 问题之间存在着很强的相似性，引入在线分配算法的设计思想，有助于设计出更实用的 Boosting 算法，他们将加权投票的相关研究成果与在线分配问题结合，并在 Boosting 问题框架下进行对应推广，得到了著名的 AdaBoost算法，该算法不再要求预知弱学习算法的任何先验知识，在实践中获得了极大的成功[1]。三、在Weka上用AdaBoost算法及几种单分类算法对草药数据进行分类本文所进行的实验在Weka3-7-1平台上完成，用三种草药三七、人参、西洋参的指纹图谱数据作为实验的数据集。本实验采用的方法是对输入数据集采用5重交叉验证，取其分类精度为的分类性能，分类精度越高表示分类效果越好。 filteredclassifier的参数设置如下： Filter为discretize，基分类器为decisionstump，其他的为默认参数设置。 AdaboostM1的参数设置如下：基分类器为decisionstump，numiteration为10，seed为1，weightThresold为100。之后执行RUN界面的START指令，再进入ANALYSE界面载入文件选择分析分类精度，可得到这些算法的平均分类精度如表1所示。四、实验结果与分析从表1可以看出，对实验输入的中草药数据集分类中，AdaBoostM1算法的分类精度大于classificationviaregression算法的分类精度。五、结论综上所述，在中草药分类领域，在与classificaitnoviaregression算法比较下，可以用AdaBoostM1算法来提高传统单分类器算法的分类性能，从而给了我们一个启发，即可以使用AdaBoostM1算法来进行草药数据集的分类以达到高的精度。参考文献 [1] 曹莹，苗启广，刘家辰，高琳. AdaBoost算法研究进展与展望[J]. 自动化学报，2013，06：745-758