- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于改进的SVM文本分类建模-Read.PDF
维普资讯
ITA
●刘秀松 (山东理工大学 图书馆,山东 淄博 255049)
基于改进的SVM文本分类建模
摘 要:SVM是一种新的分类工具,可是其核函数在数学上必须满足 Mercer条件,使得具有 良好全
局分类性能的Sigmoid函数在 SVM 中应用受到限制。本文将 Sigmoid核函数与云模型相结合,提 出一种简
单的核函数的实现方法。此方法不仅提高了SVM文本分类能力,而且明显地减少了平均的CPU执行时
间。
关键词:云模型;支持向量机 ;文本分类 ’
Abstract:SupportVectorMachine(SVM)isanewcategorizationtool,buttheapplicationofSigmoidfounc—
tionwithgoodoverallcategorizationinSVM isrestrictedbecausethekemelfunctionofSVM mustsatisfytheNercer
condition.ThispaperproposesasimplifiedmethodofachievingkernelfunctionbycombiningSigmoidkernelfunc—
tionwithcloudmode1.ThemethodnotonlyenhancesthecapabilityofSVM intextcategorization,butalsoreduces
obviouslytheaverageimplementingtimeofCPU.
Keywords:cloudmodel;SVM ;textcategorization
随着网络和通信技术的迅速发展,数据信息的极度增
2 SVM 文本分类
长阻碍了人们充分有效地利用信息资源。研究表明,80%
的信息都是包含在:史本文档中,即文本挖掘将具有很高的 支持向量机的训练集是训练文本的集合,通常表示
实用价值。文本分类是文本挖掘中的一种重要方法,通常 为:S= ((x。,Y),L (x1,Y1))c (x×Y),其中1是
采用向量空间模型 (VectorSpaceModel,VSM )。然而, 文本数 目,x指文本y是它们的标记,x表示输入空间,
向量空间模型用文:本的特征词作为向量,其向量的维数很 Y表示输出域,见图1。假设空心和实心点表示两类训练
大。支持向量机 (SVM)是在统计学习理论的基础上发展 样本 ,实线为分类面,虚线为平行于实线的平面,并且是
起来的一种新的机器学习方法,根据有限的样本信息在模 两类训练样本中离分类面最近的平面。如果训练集中的所
型的复杂性和学习能力之间寻求最佳方案,以获得最好 的
有训练样本均能被某超平面正确划分,且距该平面最近的
推广能力。它基于结构风险最小化原则 ,具有较好的分类
异类向量之间的距离最大,则该平面为最优超平面 ,用
精确性。SVM常用的核函数有线性、多项式、高斯和Sig—
w ·x+b=0表示。其中W为分类面的法线 ,b为分
moid函数。由于在神经网络 的应用中,Sigmoid函数已被
类面的偏移量,向量x位于分类面上,其中位于虚线上的
证明具有良好的全局分类性能,因此其在 SVM 中的应用
向量被称为支持向量 (图1中加圈的点)。
已经成为非常有意义的研究内容。本文提出了一种基于云
原创力文档


文档评论(0)