不确定统计学习理论基础与SVM的泛化能力研究.pdfVIP

下载本文档

9
0
约9.83千字
约 4页
2017-08-20 发布于安徽
举报
版权申诉

不确定统计学习理论基础与SVM的泛化能力研究.pdf

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第20卷(增刊) 模糊系统与数学 2006年0月 Volume andMathematics 2006 20(Supplement)FuzzySystems September 不确定统计学习理论基础及SVM的泛化能力研究哈明虎王熙照 (河北大学数学与计算机学院，保定071002) 摘要：统计学习理论和支持向量机目前已是国际上机器学习领域中新的研究热点，但建立在概率空问上基于随机样本的统计学习理论难以处理客观世界中大量存在的非概率空间上或基于模糊、粗糙、模糊随机等不确定样本的学习问题．本文简要介绍建立在非概率空间上的统计学习理论基础研究、基于不确定样本的统计学习理论基础研究以及SVM的泛化能力研究方面我们所做的工作．关键词：统计学习理论；支持向量机；不确定样本；非概率空间中图分类号：0189．1 文献标识码： A §1 引言统计理论，着重研究在小样本情况下的机器学习统计规律，是传统统计学的重要发展和补充，为研究有限样本情况下机器学习的理论和方法提供了理论框架，其核心思想是通过控制学习机器的容量实现对泛化能力的控制．基于这一理论发展出的支持向量机(SVM)方法是一种新的通用学习机器，较以往方法表现出许多理论和实践上的优势．统计学习理论所涉及的样本是随机样本．而在众多实际问题中均存在着客观的或人为的其它不确定样本，这些不确定样本的表现形式是多种多样的，如模糊性、粗糙性、模糊随机性以及其它的多重不确定性样本．这些不确定性样本必定带来大量的基于不确定性样本的统计学习问题．然而，对于这些含有不确定性样本的学习问题，现有的统计学习理论一般情况下是无能为力的．此外，统计学习理论是建立在概率空间上的，它也难以处理可信性测度、可能性测度、Sugeno测度和拟概率空间上的学习问题．因此，建立和完善统一的基于不确定空间和不确定性样本的统计学习理论不但具有重要理论价值而且具有广阔的应用前景． 1收稿日期：2006-07-12．目(No．2005001D) 模糊系统与数学第20卷(增刊】 §2 主要工作近几年来，我们在统计学习理论与支持向量机方面主要做了以下三方面的工作： 1不确定统计学习理论基础研究不确定统计学习理论基础研究包括基于随机样本、模糊样本以及模糊随机样本等不确定性样本的统计学习理论和基于非概率空间上的统计学习理论的基础研究，具体内容如下： (1)进一步讨论了可信性测度、可能性测度及Sugeno测度等一些非可加测度的性质，在这些非可加测度空间上给出相应的契比雪夫不等式和辛钦大数定律，并给出了相应空间上的经验风险泛函和期望风险泛函以及经验风险最小化原则等一系列新的概念，在此基础上，给出了这些空间上的统计学习理论的关键定理、学习过程一致收敛速度的界以及在这些界的基础上建立随机样本归纳推理原则． (2)给出了带噪音样本的期望风险泛函、经验风险泛函以及经验风险最小化归纳原则非平凡一致的定义，证明了基于带噪音样本的统计学习理论的关键定理，讨论了基于带噪音样本的学习过程一致收敛速度的界． (3)给出了模糊数函数的若干定理以及模糊随机变量函数的定理，提出了模糊风险泛函、模糊经验风险泛函以及模糊经验风险最小化(FERM)归纳原则等概念，证明了模糊(模糊随机)样本统计学习理论的关键定理，给出了模糊(模糊随机) 学习过程一致收敛速度的界． 2SVM反问题及其实现对于给定的一组没有决策属性的样本点，我们可以随机的把其分为两类．此时我们可以利用SVM的知识来求出最优分类超平面，并计算山其margin．若划分为两类机划分．SVM反问题就是如何对样本点进行划分，才能使最优分类超平面的margin 达到最大．对SVM反问题的研究是源自于设计一种新的决策树生成算法．现有的很多决策树算法如CA．5，往往得不到好的执行效果，由于支持向量机中最优分