一种改进的SVM文本数据分类技术研究.pdfVIP

一种改进的SVM文本数据分类技术研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 28卷 第 4期 科 技 通 报 V01.28 No.4 2012年 4月 BULLETIN OFSCIENCEAND TECHNOLOGY Apr.2012 一 种改进的SVM文本数据分类技术研究 高晓琴 (四川工商职业技术学院 信息工程系,成都 611830) 摘 要:主要研究了文本分类精度 问题 。介绍了文本分类的基本过程 ,提出了一种改进的支持向量机文 本分类技术 ,设计并实现了一个开放的中文文档 自动分类系统。实验结果表明,提出的方法不仅具有较 高的训练效率 ,同时也能得到很高的分类准确率和查全率。 关键词:文本挖掘;文本分类;支持向量机;向量空间模型 中图分类号:TP391 文献标识码 :A 文章编号:1001-7119(2012)04-0070-02 AnImprovedSVM TextDataClassificationTechnologyResearch GA0Xiaoqin (SichuanTechnologyandBusinessCollege,Chengdu611830,China) Abstract:onthemaintextclassificationaccuracy.Thispaperfirstintroducesthe.basicprocessoftextclassification,this paperproposesanimprovedsupportvectormachineSVM textclassificationtechnology,thedesignandimplementationof anopenautomaticChinesedocumentsclassificationsystem.Theexperimentalresultsshow that,theproposedmethodnot onlyhashightrainingefficiency,atthesametimecanobtaintheveryhighclassificationaccuracyrateandrecallrate. Keywords:textmining;textclassification;supportvectormachine;vectorspacemodel 文本数据挖掘又称为亦文本挖掘,从文本数据库 化原则的。与传统的算法不同,它不仅优化经验风险, 中发现知识,以文本数据为特定挖掘对象的数据挖掘 , 而且通过最大化分界面来控制模型的复杂度 ,从而有 是数据挖掘地扩展。从 目前文本挖掘技术的研究和应 效地避免了过学习现象,为模型选择 问题提供了很好 用状况来看 ,从语义的角度来实现文本挖掘的很多,目 的思路 。 前研究和应用最多的几种文本挖掘技术有 :文档聚类、 对于给定样本点通过以下的步骤做二值分类: 文档分类和摘要抽取J一『。王永成[31等研制的基于神经网 (xl,y1),…,(r1),∈R,yi∈{一1,+1} (1) 络优化算法的中文文本 自动分类系统。近期研究中比 其中 向量从对象样本集中抽取某些向量 ,可以 较突出的是中科院的中文文本智多星分类器,它采用 是从特征向量中直接抽取,也可 以是从映射 向量中抽 多种分类方法。本文基于 以上文献基础上,提出了一种 取。在特征空间中构造分割平面: 改进的支持向量机文本分类技术 ,首先介绍了文本分 (W·)+6=0 (2) 类的基本过程,设计并实现了一个开放的中文文档 自

文档评论(0)

神话 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5203223011000000

1亿VIP精品文档

相关文档