基于最大间隔的决策树归纳算法.pdfVIP

下载本文档

26
0
约1.01万字
约 3页
2017-09-12 发布于安徽
举报
版权申诉

基于最大间隔的决策树归纳算法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

优秀博硕毕业论文，完美PDF内部资料、支持编辑复制，值得参考！

Science technologyview 科教前哨科技视界 2011年8月第22期基于最大问隔的决策树归纳算法焦树军安志江 (河北华航通信技术有限公司河北石家庄 050031) 摘【要】决策树归纳是归纳学习的一种。由于NP困难，寻找最优的决策树是不现实的，从而探索各种启发式算法去产生一个高精度的决策树变成了这类研究的焦点。考虑到支持向量机(SVM)的分类间隔与泛化能力的关系，可以使用SVM 的最大间隔作为生成决策树的启发式信息，使得决策树有较强的泛化能力。本文针对实值型数据，提出了一种基于最大间隔的决策树归纳算法。实验结果表明了本文算法的有效性。【关键词】支持向量机；支持向量机反问题；间隔；决策树归纳 0 引言可以被一个超平面 · 咖6=0 (1) 决策树归纳是归纳学习中最实用最重要的学习和推理分开。如果这个向量集合被超平面没有错误的分开，并方法，由于构造最优的决策树问题已经被证明是 NP完全问且离超平面最近的向量与超平面之间的距离是最大的。则我题l2 ，因此典型的决策树学习算法都是在完全假设空间的自们说这个向量集合被这个最优超平面 (或最大间隔超平面) 顶向下的贪心搜索算法．但各搜索算法所采用的启发式有所分开。如图1所示。不同。其中选用最小信息熵为启发式信息的ID3算法是一个典型代表．这种方法生成的决策树规模小且计算复杂度低。但其泛化能力(generalization)／[佳。统计学习理论(StatisticalLearningTheory或 SET)是一种 ● 专门研究小样本情况下机器学习规律的理论，它是建立在一套较坚实的理论基础之上的，为解决有限样本学习问题提供 o 了一个统一的框架。V．Vapnik等人从六、七十年代开始致力于此方面研究翻，到九十年代中期，随着其理论的不断发展和 ● 成熟，也由于神经网络等学习方法在理论上缺乏实质性进展，统计学习理论开始受到越来越广泛的重视。在这一理论基础上发展了一种新的通用学习方法——支持向量机图1 最优分类超平面是以最大间隔将数据分开的超平面 (SupportVectorMachine或SVM)，它已初步表现出很多优于已我们使用下面的形式：来描述分类超平面：有方法的性能，尤其是较强的泛化能力。 (to’)舶 1,yl=1 根据统计学习理论，SVM分类间隔越大，泛化能力越强，。 6 一1， =一1 考虑到这一关系，我们可以用最大间隔作为决策树归纳的启发式信息，以此来划分决策树结点，构造决策树。一方面，可并且有紧凑形式：以从原始数据中产生高质量的决策树，最大限度地提高决策 Yi[’ 6]≥1,i=1，2，．．．，t (2) 树对新观察事例的预测准确性；另一方面，理论上它将两种容易验证，将样本点