基于改进的SVM文本分类建模-Read.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于改进的SVM文本分类建模-Read.PDF

维普资讯 ITA ●刘秀松 (山东理工大学 图书馆,山东 淄博 255049) 基于改进的SVM文本分类建模 摘 要:SVM是一种新的分类工具,可是其核函数在数学上必须满足 Mercer条件,使得具有 良好全 局分类性能的Sigmoid函数在 SVM 中应用受到限制。本文将 Sigmoid核函数与云模型相结合,提 出一种简 单的核函数的实现方法。此方法不仅提高了SVM文本分类能力,而且明显地减少了平均的CPU执行时 间。 关键词:云模型;支持向量机 ;文本分类 ’ Abstract:SupportVectorMachine(SVM)isanewcategorizationtool,buttheapplicationofSigmoidfounc— tionwithgoodoverallcategorizationinSVM isrestrictedbecausethekemelfunctionofSVM mustsatisfytheNercer condition.ThispaperproposesasimplifiedmethodofachievingkernelfunctionbycombiningSigmoidkernelfunc— tionwithcloudmode1.ThemethodnotonlyenhancesthecapabilityofSVM intextcategorization,butalsoreduces obviouslytheaverageimplementingtimeofCPU. Keywords:cloudmodel;SVM ;textcategorization 随着网络和通信技术的迅速发展,数据信息的极度增 2 SVM 文本分类 长阻碍了人们充分有效地利用信息资源。研究表明,80% 的信息都是包含在:史本文档中,即文本挖掘将具有很高的 支持向量机的训练集是训练文本的集合,通常表示 实用价值。文本分类是文本挖掘中的一种重要方法,通常 为:S= ((x。,Y),L (x1,Y1))c (x×Y),其中1是 采用向量空间模型 (VectorSpaceModel,VSM )。然而, 文本数 目,x指文本y是它们的标记,x表示输入空间, 向量空间模型用文:本的特征词作为向量,其向量的维数很 Y表示输出域,见图1。假设空心和实心点表示两类训练 大。支持向量机 (SVM)是在统计学习理论的基础上发展 样本 ,实线为分类面,虚线为平行于实线的平面,并且是 起来的一种新的机器学习方法,根据有限的样本信息在模 两类训练样本中离分类面最近的平面。如果训练集中的所 型的复杂性和学习能力之间寻求最佳方案,以获得最好 的 有训练样本均能被某超平面正确划分,且距该平面最近的 推广能力。它基于结构风险最小化原则 ,具有较好的分类 异类向量之间的距离最大,则该平面为最优超平面 ,用 精确性。SVM常用的核函数有线性、多项式、高斯和Sig— w ·x+b=0表示。其中W为分类面的法线 ,b为分 moid函数。由于在神经网络 的应用中,Sigmoid函数已被 类面的偏移量,向量x位于分类面上,其中位于虚线上的 证明具有良好的全局分类性能,因此其在 SVM 中的应用 向量被称为支持向量 (图1中加圈的点)。 已经成为非常有意义的研究内容。本文提出了一种基于云

您可能关注的文档

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档